Das Animieren einer 3D-Figur von Grund auf ist im Allgemeinen sowohl mühsam als auch teuer und erfordert den Einsatz komplexer Software und Motion-Capture-Tools. Radschlagen möchte grundlegende Animationen so einfach machen wie ihre Beschreibung, eine grundlegende Bewegung mithilfe von KI generieren und es den Entwicklern ermöglichen, sich auf ausdrucksstärkere Aufgaben zu konzentrieren.
„Seit ich damit angefangen habe, hat es nicht viel Neues in der Animation gegeben“, sagte Jonathan Jarvis, Mitbegründer und CEO des Startups und selbst Animator. „Es gibt das große Problem des ‚leeren Bildschirms‘, wo es Millionen von Schaltflächen und Optionen gibt. Manchmal arbeitet man stundenlang an etwas, bevor man überhaupt sieht, wie es aussieht.“
Bei der Funktion „Cartwheel“ soll dieser erste Schritt übersprungen werden, d. h. man gelangt von Null zur Grundbewegung. Animatoren, die eine Szene oder einen Charakter erstellen möchten, müssen daher nicht so viel Zeit mit elementaren Bewegungen wie dem Ausführen eines Schrittes, dem Erschlagen einer Fliege oder dem Hinsetzen verbringen.
„Wir helfen dabei, eine Bewegung zu erzeugen, die man mit einem Motion-Capture-Setup oder durch Keying erreichen würde. [i.e. animating via keyframe] selbst, nur viel schneller. Es ist sehr wertvoll, es schnell aus dem Kopf zu bekommen und loszulegen. Dann kann man es nehmen und optimieren“, sagte Jarvis.
Die Benutzeroberfläche ist bewusst einfach gehalten und besteht nur aus einem Zeichen und einem Textfeld. Sie können dort praktisch alles hineinschreiben und in ein oder zwei Minuten haben Sie eine einfache, aber flüssige Animation, die Sie dann in jede normale 3D-Bearbeitungssuite exportieren können.
Sie können sich auch Live-3D-Beispiele auf ihrer Website ansehen, wie dieses Boxen oder ein kleiner Kerl einen Solo-Walzer tanzen.
„Das von ihnen gebaute Modell ist völlig originell“, sagte Mitbegründer Andrew Carr, zugleich Chefwissenschaftler des Unternehmens.
„Wir haben mehrere Datenquellen, die alle ethisch einwandfrei sind, und unsere eigenen Labeler, die diese Bewegungen kennzeichnen“, erklärte er. „Bewegung wird als Matrix dargestellt – das ist in der Literatur bekannt – eine Matrix mit Posen, Zeit, Geschwindigkeit und so weiter. Sie verknüpfen also die Bewegungsmatrix mit einer Textbeschreibung der Bewegung und führen ein ziemlich standardmäßiges Training mit Bewegungs-Sprachpaaren durch, genauso wie Sie Bilder oder Videos generieren würden.“
Die Animationen, die Sie erhalten, sind „im Durchschnitt zu etwa 80 % fertig“, schätzte Carr. Jarvis sagte, es könne beeindruckende, professionelle Ergebnisse hervorbringen, „und manchmal ist es ein Reinfall“. Aber es ist wesentlich schneller und einfacher als ein traditioneller Animations-Workflow, insbesondere in Umgebungen, in denen mehrere Künstler an einem Prozess arbeiten und selbst kleine Anpassungen nach und nach vorgenommen werden müssen.
Die von ihnen verwendeten Modelle sind nicht einmal so groß, was bedeutet, dass ihr Betrieb günstiger ist und sie möglicherweise lokal gehostet werden könnten.
„Das ist wirklich cool“, sagte Carr. „Bei einem Videomodell müssen Sie 2.000 x 2.000 Pixel vorhersagen, jedes Bild mit 60 Bildern pro Sekunde … das ist einfach eine gewaltige Sache, mit der man zurechtkommen muss. Was wir vorhersagen, ist um eine Größenordnung oder noch kleiner; es kann auf der CPU oder älteren GPUs laufen, und wir können Modelle schneller trainieren.“
Jarvis meinte sogar, dass sie irgendwann in der Lage sein könnten, neue oder veränderte Animationen spontan zu rendern, ein heiliger Gral für die Interaktivität in Spielen, wo Charaktere im Allgemeinen auf eine Reihe vorgefertigter Bewegungen und Dialogzeilen beschränkt sind. Dinge wie Kamerabewegungen und -winkel können ebenfalls intuitiv beschrieben werden, und nicht-menschliche Charaktere sind ebenfalls in Planung – obwohl sich das Startup zunächst auf menschliche Animationen konzentriert, da diese bei weitem am häufigsten benötigt werden.
Es erinnert in gewisser Weise daran, wie Wonder Dynamics den Prozess der Einfügens von 3D-Charakteren stark vereinfacht hat. Dabei lag der Fokus nicht darauf, Animatoren oder Künstler zu ersetzen, sondern darauf, die repetitive Plackerei elementarer Animationsarbeit zu überspringen. Die gesamte Branche hat KI-nahe Tools als Zeitsparer angenommen, die es ihren Kreativen ermöglichen, sich mehr auf die Kreation zu konzentrieren. Autodesk hat dies jedenfalls getan, wie die Übernahme von Wonder Dynamics vor zwei Wochen zeigt.
Es mag ein wenig unpassend sein, über das endgültige Schicksal eines Startups zu spekulieren, während es gerade erst anfängt, aber Cartwheel könnte es durchaus genauso ergehen: Es wird als vielversprechendes und leistungsstarkes Feature aufgekauft, das sich als Vorteil gegenüber der Konkurrenz erweisen könnte. Aber es könnte sich auch als plattformunabhängiges Tool etablieren und professionellen Animatoren eine wachsende Palette an Diensten anbieten.
Wie dem auch sei, das Unternehmen hat seine erste Finanzierungsrunde gesichert: ein Startkapital von 5,6 Millionen US-Dollar unter der Leitung von Accel, mit Beteiligung von Khosla Ventures, Human Ventures, Heretic VC, MVP Ventures, Correlation Ventures und Pelion VC – und, wie es Tradition ist, einer Handvoll Business Angels.
Im Moment ist Cartwheel eine der vielen Prosumer-Apps, auf die sich Animatoren bei ihrer Arbeit verlassen. Sie können es selbst testen, wenn Sie melde dich für die Beta an.
„Es gibt diese Vorstellung, dass KI kreative Arbeit ersetzt, und als jemand, der kreative Arbeit leistet, sagt man: Nein! Das führt zu mehr Animation, mehr Bewegung, einer Person, die mehr macht“, sagte Jarvis. „Und das wird schließlich zu den großen Studios gelangen, die unglaubliche Dinge machen werden, an die wir noch nicht einmal gedacht haben. Aber zwischen den Pixars und den Leuten, die auf ihren Handys spielen, gibt es eine ganze Reihe von Ebenen, und dort wird ein Großteil der kreativen Arbeit wirklich erledigt.“