Die neuesten generativen Modelle eignen sich hervorragend für Demos. Doch werden sie wirklich die Art und Weise verändern, wie Menschen Filme und Fernsehen machen? Film- und VFX-Experten zufolge nicht kurzfristig – doch langfristig könnten die Veränderungen buchstäblich jenseits unserer Vorstellungskraft liegen.
Auf einem Panel bei SIGGRAPH in Denver diskutierten Nikola Todorovic (Wonder Dynamics), Freddy Chavez Olmos (Boxel Studio) und Michael Black (NetzkapadeMax-Planck-Institut) diskutierten das Potenzial generativer KI und anderer Systeme, die Art und Weise der Medienerstellung heute zu verändern – aber nicht unbedingt zu verbessern. Sie waren sich einig, dass wir die Nützlichkeit dieser Tools in der unmittelbaren Zukunft zwar zu Recht in Frage stellen können, die Innovationsgeschwindigkeit jedoch so hoch ist, dass wir in Zukunft jederzeit auf radikale Veränderungen vorbereitet sein sollten.
Eines der ersten behandelten Themen war die Unpraktikabilität der heutigen Videogeneratoren.
Todorovic bemerkte die „Fehlvorstellung von KI, dass es sich um eine Ein-Klick-Lösung handelt, mit der man eine finale VFX-Aufnahme erhält, und das ist wirklich unmöglich. Vielleicht kommen wir dahin, aber wenn man keine Editierbarkeit hat, bringt einem diese Blackbox nicht viel. Was wir gerade sehen, ist, dass die UX noch entdeckt wird – diese Forschungsunternehmen beginnen, die Methoden von 3D und die Begriffe des Filmemachens zu lernen.“
Black wies darauf hin, dass der Sprache grundsätzlich die Fähigkeit fehle, einige der wichtigsten Aspekte der visuellen Gestaltung zu beschreiben.
„Ich meine, Dinge wie Yoga-Posen, Ballett-Posen, es gibt einige klassische Dinge, für die wir Namen haben, die wir definieren können, aber für die meisten Dinge, die wir tun, haben wir keine Namen“, sagte er. „Und dafür gibt es einen guten Grund: Der Mensch hat tatsächlich ein generatives Verhaltensmodell in sich. Aber ich habe kein generatives Modell für Bilder in meinem Kopf; wenn ich Ihnen erklären möchte, was ich sehe, kann ich es nicht aus meinen Augäpfeln projizieren, und ich bin kein guter genuger Künstler, um es für Sie zu zeichnen. Also muss ich Worte verwenden, und wir haben viele Worte, um die visuelle Welt zu beschreiben. Aber wenn ich Ihnen eine bestimmte Bewegung beschreiben möchte, muss ich sie nicht in Worten beschreiben – ich mache es einfach für Sie, und dann sieht mich Ihr motorisches System und ist aktiv dabei, das zu verstehen. Und ich denke, es hat einen biologischen Grund, einen neurowissenschaftlichen Grund, dass wir nicht für alle unsere Bewegungen Worte haben.“
Das mag ein wenig philosophisch klingen, aber das Ergebnis ist, dass textbasierte Eingabeaufforderungssysteme für Bilder grundsätzlich in ihrer Steuerbarkeit eingeschränkt sind. Sogar die Hunderte von technischen und künstlerischen Begriffen, die täglich am Set und in der Nachbearbeitung verwendet werden, sind unzureichend.
Chavez Olmos wies darauf hin, dass er als Mexikaner kaum Möglichkeiten hatte, in der Filmbranche mitzuwirken, da sich das ganze Geld und die ganze Expertise in LA konzentrierten. Er sagte jedoch, dass KI-Expertise (und die Nachfrage danach) breiter gestreut sei. „Ich musste Mexiko verlassen, weil ich dort keine Chance hatte. Ich kann mir vorstellen, dass es jetzt dieselben Möglichkeiten für Leute gibt, die dafür nicht ins Ausland gehen müssen.“
Black befürchtet jedoch, dass ein plötzlicher Zugriff auf diese Prozesse kurzfristig unbeabsichtigte Folgen haben könnte.
„Man kann jemandem ein leistungsstarkes Auto geben, aber das macht ihn noch lange nicht zum Formel-1-Fahrer, oder? Das ist ein bisschen wie das, was wir jetzt haben. Die Leute reden davon, dass jeder Filme machen wird. Sie werden ganz ehrlich sein“, sagte er. „Die Demokratisierungssache ist genau das, was [Chavez Olmos] gesagt, und die Macht liegt darin, dass vielleicht eine neue Stimme eine Chance bekommt, die sie sonst nicht hätte. Aber die Zahl der Leute, die wirklich gute Filme machen, wird meiner Meinung nach immer noch gering sein.“
„Die wahre Revolution“, fuhr er fort, „die wahre Macht dessen, was wir in der KI erleben, ist, dass wir ein völlig neues Genre der Unterhaltung erleben werden, und ich weiß nicht genau, wie es aussehen wird. Ich sage voraus, es wird etwas zwischen Videospielen, Filmen und dem echten Leben sein. Die Filmindustrie ist passives Geschichtenerzählen: Ich sitze da und beobachte, es ist wie im Theater oder bei einem Podcast. Ich bin der passive Empfänger der Unterhaltung. Aber in unserem täglichen Leben erzählen wir uns gegenseitig Geschichten, wir unterhalten uns darüber, was wir am Wochenende gemacht haben und so weiter. Und das ist eine sehr aktive Art des interaktiven Geschichtenerzählens.“
Bevor es jedoch dazu kommt, erwartet Chavez Olmos eine traditionellere Akzeptanzkurve für KI-generierte Bilder und Schauspieler:
„Ich glaube, es wird die gleiche Reaktion hervorrufen wie beim ersten ‚Final Fantasy‘-Film oder ‚Der Polarexpress‘ – es wird noch nicht ganz so weit sein, aber die Leute werden anfangen, diese Filme zu akzeptieren. Und statt eines reinen Computeranimationsfilms wird es ein reiner KI-Film sein, was wir, glaube ich, sogar noch Ende dieses Jahres sehen werden. Ich glaube, die Leute werden darüber hinwegkommen und denken: ‚OK, das ist KI‘, die Leute werden das akzeptieren.“
„Das Wichtigste ist, und das hat uns Pixar sehr deutlich beigebracht: Es geht um die Geschichte. Es geht darum, eine Verbindung zu den Charakteren aufzubauen. Es geht um Herz. Und wenn der Film Herz hat, ist es egal, ob die Charaktere KI sind. Ich denke, die Leute werden den Film genießen, wenn er Herz hat“, sagte Black. „Das heißt nicht, dass sie keine menschlichen Schauspieler wollen. Es ist aufregend zu wissen, dass es echte Menschen wie uns sind, aber viel besser als wir. Einen Menschen auf dem Höhepunkt seiner Karriere zu sehen, inspiriert uns alle, und ich glaube nicht, dass das so bleiben wird.“