Sora, der Videogenerator von OpenAI, startet am Montag – zumindest für einige Benutzer.
YouTuber Marques Brownlee enthüllte die Neuigkeiten in einem Video, das am Montagmorgen auf seinem Kanal veröffentlicht wurde. Brownlee erhielt frühzeitig Zugang zu Sora und gab in einem 15-minütigen Rückblick seine ersten Eindrücke preis.
Sora lebt weiter Sora.comsagte Brownlee, dessen Homepage eine Liste kürzlich erstellter und von OpenAI kuratierter Sora-Videos zeigt. (Zum Zeitpunkt der Veröffentlichung war es für uns hier bei Tech noch nicht live gegangen.) Insbesondere ist das Tool nicht in ChatGPT, der KI-gestützten Chatbot-Plattform von OpenAI, integriert. Sora scheint vorerst ein eigenständiges Produkt zu sein.
Videos auf der Sora-Homepage können für die spätere Ansicht auf der Registerkarte „Gespeichert“ mit einem Lesezeichen versehen, in Ordnern organisiert und angeklickt werden, um zu sehen, welche Textaufforderungen zur Erstellung verwendet wurden. Laut Brownlee kann Sora Videos aus hochgeladenen Bildern sowie Eingabeaufforderungen generieren und vorhandene, von Sora stammende Videos bearbeiten.
Mit der Funktion „Remix“ können Benutzer Änderungen beschreiben, die sie in einem Video sehen möchten, und Sora wird versuchen, diese in einen neu generierten Clip zu integrieren. Re-Mix verfügt über eine „Stärke“-Einstellung, mit der Benutzer festlegen können, wie stark Sora das Zielvideo ändern soll. Höhere Werte ergeben Videos, die mehr künstlerische Freiheiten erfordern.
Sora kann bis zu 1080p-Filmmaterial erzeugen, sagte Brownlee – aber je höher die Auflösung, desto länger dauert die Erstellung der Videos. 1080p-Filmmaterial dauert achtmal länger als 480p, die schnellste Option, während 720p viermal länger dauert.
Brownlee sagte, dass die Erstellung eines 1080p-Videos in seinen Tests durchschnittlich „einige Minuten“ gedauert habe. „Das ist auch so, als ob es gerade jetzt so gut wie niemand sonst nutzt“, sagte er. „Ich frage mich, wie lange es noch dauern wird, wenn es einfach für jedermann zugänglich ist.“
Neben der Generierung einmaliger Clips verfügt Sora über eine „Storyboard“-Funktion, mit der Benutzer Eingabeaufforderungen aneinanderreihen können, um Szenen oder Videosequenzen zu erstellen, sagte Brownlee. Dies soll vermutlich zur Konsistenz beitragen – eine berüchtigte Schwachstelle für KI-Videogeneratoren.
Aber wie schlägt sich Sora? Nun, sagte Brownlee, weist es die gleichen Mängel auf wie andere generative Tools auf dem Markt, nämlich Probleme im Zusammenhang mit der Objektpermanenz. In Sora-Videos laufen Objekte auf sinnlose Weise vor- oder hintereinander vorbei und verschwinden und tauchen ohne Grund wieder auf.
Die Beine seien eine weitere große Ursache für Soras Probleme, sagte Brownlee. Immer wenn eine Person oder ein Tier mit Beinen in einem Clip längere Zeit laufen muss, verwechselt Sora die Vorder- und Hinterbeine. Die Beine würden auf anatomisch unmögliche Weise hin und her „wechseln“, sagte Brownlee.
Sora verfügt laut Brownlee über eine Reihe eingebauter Sicherheitsvorkehrungen und verbietet Urhebern die Erstellung von Filmmaterial, das Personen unter 18 Jahren zeigt und Gewalt oder „explizite Themen“ enthält und das Urheberrecht Dritter verletzen könnte. Laut Brownlee generiert Sora auch keine Videos aus Bildern mit Persönlichkeiten des öffentlichen Lebens, erkennbaren Charakteren oder Logos und versieht jedes Video mit einem Wasserzeichen – allerdings mit einem visuellen Wasserzeichen, das leicht herausgeschnitten werden kann.
Also, wofür ist Sora gut? Brownlee fand es nützlich für Dinge wie Titelfolien in einem bestimmten Stil, Animationen, Zusammenfassungen und Stop-Motion-Filmmaterial. Aber er schreckte davor zurück, es für irgendetwas Fotorealistisches zu befürworten.
„Es ist beeindruckend, dass es sich um ein KI-generiertes Video handelt, aber man erkennt ziemlich schnell, dass es sich um ein KI-generiertes Video handelt“, sagte er über die meisten Clips von Sora. „Es wird einfach richtig schief.“