In dem Video brüllt eine Menge bei einem voll besetzten Sommermusikfestival. Als ein Beat aus den Lautsprechern ertönt, betritt der Künstler endlich die Bühne: Es ist der Joker. In seinem roten Anzug, mit grünem Haar und seiner charakteristischen Gesichtsbemalung ballt der Joker seine Faust und tanzt über die Bühne. Er hüpft einen Laufsteg hinunter, um noch näher an sein Meer von Fans zu kommen. Als es Zeit ist, mit dem Rappen zu beginnen, beugt der Joker seine Knie und stößt sich vom Boden ab, hüpft auf und ab, bevor er auf einem Fuß eine 360-Grad-Drehung macht. Es sieht mühelos aus, aber wenn Sie das Manöver versuchen würden, würden Sie der Länge nach auf Ihr Gesicht fallen. Der Joker war noch nie so cool.
Dann gibt es noch ein weiteres Video, in dem NBA All-Star Joel Embiid stolziert hinter der Bühne hervor, um die Menge zu begrüßen, bevor er dieselben Tanzschritte vorführt. Dann ist es der Star von „Lass es, Larry!“ Larry DavidDoch in jeder dieser Szenen stimmt irgendetwas nicht ganz: Ob beim Joker, bei Joel Embiid oder bei Larry David, die Körper der Darsteller zittern, während sich ihre Mimik nie ändert.
Natürlich ist das alles KI-generiert, dank einer Firma namens Viggle.
Das Originalvideo zeigt den Rapper Lil Yachty, wie er beim Summer Smash Festival 2021 die Bühne betritt – laut dem Titel eines YouTube-Videos mit über 6,5 Millionen Aufrufen ist dieser Auftritt „der SCHWERSTE Abschied aller Zeiten.„Dies entwickelte sich im April zu einem trendigen Meme-Format, als die Leute ihre Lieblingsstars einfügten – oder ihre Lieblings Bösewichtewie Sam Bankman-Fried – in das Video von Lil Yachty, der die Bühne betritt.
Text-zu-Video-KI-Angebote werden beängstigend gut, aber Sie können nicht „Sam Bankman-Fried als Lil Yachty beim Sommerhit 2021“ eintippen und erwarten, dass Sora genau weiß, was Sie meinen. Viggle funktioniert anders.
Auf Viggles Discord-Server laden Benutzer ein Video von jemandem hoch, der eine Bewegung ausführt – oft einen TikTok-Tanz – und ein Foto einer Person. Dann erstellt Viggle ein Video von dieser Person, in dem sie die Bewegungen aus dem Video nachahmt. Es ist offensichtlich, dass diese Videos nicht echt sind, aber sie sind trotzdem unterhaltsam. Aber nachdem das Lil Yachty-Meme viral ging, wurde Viggle heiß und der Hype hat nicht nachgelassen.
„Wir konzentrieren uns auf den Aufbau dessen, was wir das steuerbare Videogenerierungsmodell nennen“, sagte Viggle-Gründer Hang Chu gegenüber Tech. „Wenn wir Inhalte generieren, wollen wir genau steuern, wie sich die Figur bewegt oder wie die Szene aussieht. Aber die aktuellen Tools konzentrieren sich nur auf die Text-zu-Video-Seite, wo der Text selbst nicht ausreicht, um alle visuellen Feinheiten festzulegen.“
Laut Chu gibt es bei Viggle zwei Haupttypen von Benutzern: Während einige Leute Memes erstellen, verwenden andere das Produkt als Werkzeug im Produktionsprozess für Gamedesign und visuelle Effekte (VFX).
„Beispielsweise könnte ein Team von Animationsingenieuren einige Konzeptentwürfe nehmen und sie schnell in grobe, aber schnelle Animationselemente umwandeln“, sagte Chu. „Der ganze Sinn besteht darin, zu sehen, wie sie in der groben Skizze des endgültigen Plans aussehen und wirken. Normalerweise dauert es Tage oder sogar Wochen, bis sie das manuell eingerichtet haben, aber mit Viggle kann dies im Grunde sofort und automatisch erledigt werden. Dies erspart jede Menge mühsame, sich wiederholende Modellierungsarbeit.“
Im März hatte Viggles Discord ein paar Tausend Mitglieder. Mitte Mai waren es bereits 1,8 Millionen Mitglieder und nur wenige Tage vor Juni ist Viggles Server auf über 3 Millionen Mitglieder angewachsen. Damit ist er größer als die Server für Spiele wie Valorant und Genshin Impact zusammen.
Viggles Wachstum zeigt keine Anzeichen einer Verlangsamung, außer dass die hohe Nachfrage nach Videogenerierung die Wartezeiten für ungeduldige Benutzer etwas zu lang gemacht hat. Da Viggle jedoch so stark auf Discord ausgerichtet ist, hat das Entwicklerteam von Discord direkt mit Viggle zusammengearbeitet, um das zwei Jahre alte Startup durch sein schnelles Wachstum zu führen.
Zum Glück für Viggle hat Discord das schon einmal durchgemacht. MidJourney, das ebenfalls auf Discord läuft, hat 20,3 Millionen Mitglieder auf seinem Server und ist damit die größte einzelne Community auf der Plattform. Insgesamt hat Discord etwa 200 Millionen monatliche Benutzer.
„Niemand ist bereit für diese Art von Wachstum, also beginnen wir in dieser Viralitätsphase mit ihnen zu arbeiten, weil sie noch nicht bereit sind“, sagte Ben Shanken, VP of Product bei Discord, gegenüber Tech. „Wir müssen bereit sein, denn ein großer Teil der derzeit gesendeten Nachrichten sind Viggle und MidJourney, und ein Großteil des Konsums und der Nutzung von Discord ist tatsächlich generative KI.“
Für Startups wie Viggle und MidJourney bedeutet die Entwicklung ihrer Apps auf Discord, dass sie keine ganze Plattform für ihre Benutzer aufbauen müssen – stattdessen werden sie auf einer Plattform gehostet, die bereits über ein technisch versiertes Publikum sowie integrierte Tools zur Inhaltsmoderation verfügt. Für Viggle, das nur fünfzehn Mitarbeiter hat, ist die Unterstützung von Discord von entscheidender Bedeutung.
„Wir können uns auf den Aufbau des Modells als Backend-Dienst konzentrieren, während Discord seine Infrastruktur auf dem Frontend nutzen kann, und im Grunde können wir schneller iterieren“, sagte Chu.
Vor Viggle war Chu KI-Forscher bei Autodesk, einem 3D-Tool-Riesen. Er forschte auch für Unternehmen wie Facebook, Nvidia und Google.
Für Discord könnte es mit Kosten verbunden sein, als zufälliges SaaS-Unternehmen für KI-Startups aufzutreten. Einerseits bringen diese Apps ein neues Publikum zu Discord und sind wahrscheinlich gut für die Nutzerzahlen. Aber so viele Videos zu hosten kann technisch schwierig und kostspielig sein, insbesondere wenn andere Benutzer auf der Plattform Live-Videospiele, Video-Chats und Sprachanrufe streamen. Ohne eine Plattform wie Discord könnten diese Startups jedoch möglicherweise nicht im gleichen Tempo wachsen.
„Es ist für kein Unternehmen einfach, zu skalieren, aber Discord ist für diese Art von Skalierung ausgelegt und wir können ihnen dabei helfen, das ziemlich gut zu verkraften“, sagte Shanken.
Diese Unternehmen können zwar einfach Discords eigene Inhaltsrichtlinien übernehmen und seine Apps zur Inhaltsmoderation verwenden, es wird jedoch immer eine Herausforderung sein, sicherzustellen, dass sich 3 Millionen Menschen benehmen. Sogar diese Walk-Out-Memes von Lil Yachty verstoßen technisch gesehen gegen die Regeln von Viggle, die Benutzer dazu anhalten, keine Bilder von echten Menschen – einschließlich Prominenten – ohne deren Zustimmung zu erstellen.
Viggles Rettung könnte im Moment sein, dass seine Ergebnisse noch nicht hundertprozentig realistisch sind. Die Technik ist wirklich beeindruckend, aber wir wissen es besser. Diese schäbige Joker-Animation ist definitiv nicht echt, aber sie ist auf jeden Fall lustig.