OpenAI hat ein Tool angekündigt, das Texte in kurze Videos umwandeln kann. Sora generiert Videos mit einer Länge von bis zu einer Minute. Die Software nutzt Trainingsdaten aus lizenzierten und „öffentlichen“ Quellen und steht derzeit nur Forschern zur Verfügung.
Der Videos die Sora generiert, kann aus mehreren Charakteren und Elementen bestehen. „Das Modell versteht nicht nur, was der Benutzer in der Eingabeaufforderung gefragt hat, sondern auch, wie diese Dinge in der physischen Welt existieren“, berichtet OpenAI über das Tool.
Gleichzeitig sagt OpenAI, dass Sora Einschränkungen hat. Beispielsweise hat die Software Schwierigkeiten, physikalische Gesetze in komplexen Szenen, etwa beim Zerbrechen von Glas, genau zu simulieren. Es würde auch Ursache und Wirkung noch nicht „verstehen“. Das Unternehmen nennt als Beispiel eine Figur, die in einen Keks beißt, der Keks dann aber wieder ganz ist.
Es ist noch nicht bekannt, wann Sora für Benutzer verfügbar sein wird. Das Tool steht vorerst nur Forschern zur Verfügung, um Feedback einzuholen und mögliche Risiken zu identifizieren. Inwieweit das Unternehmen öffentliche Quellen zum Trainieren des Modells nutzen kann, ist derzeit nicht bekannt Gegenstand von Klagen.
Sora ist nicht die einzige Software, die Text in Videos umwandeln kann. Runway, einer der Hersteller hinter dem Bildgenerator Stable Diffusion, veröffentlichte a ähnliches Werkzeug aus.