Der gik kun 24 timer efter at Google havde annonceret deres Gemini 1.5 Pro version til OpenAI slog tilbage og stjal rampelyset med annonceringen af deres video-generator Sora. Efterhånden har OpenAI, virksomheden bag ChatGPT, DALL-E og GPT-4, en vane med at overgå sine konkurrenter og selvom Gemini 1.5 tilsyneladende indhenter GPT-4 eller ligefrem overgår den, så er Sora bare en meget større nyhed!
Navngivet efter det japanske ord for "himmel", er Sora OpenAIs første forsøg med AI-genereret video ved hjælpe af en banebrydende tekst-til-video-model. Sora kan ifølge OpenAI "skabe realistiske og fantasifulde scener ud fra tekstinstruktioner." Videoerne kan være omkring et minut lange, og kvaliteten er nærmest på Hollywood-niveau.
Sora forventes at blive frigivet som en del af ChatGPT, hvor brugerne vil kunne generere video fra simple tekstinstruktioner. Først skal modellen dog tjekkes yderligere igennem for fejl og sårbarheder, så vi med nøjes med at smugkigge på de promotion-videoer OpenAI har lagt ud.
Selvom funktionaliteten sikkert i starten vil have sine begrænsninger, så skal man huske hvor absurd hurtigt tingene udvikler sig. For et år siden kunne man knap generere realistiske billeder og nu kan producere video i høj kvalitet - det er "mindblowing" hvor hurtigt det går.
Se nogle af de imponerende videoer her på OpenAIs website.
-