Flo Crivello überwachte die Ergebnisse der KI-Assistenten seines Unternehmens Lindy macht, als ihm etwas Seltsames auffiel. Eine neue Kundin hatte ihren Lindy-KI-Assistenten um ein Video-Tutorial gebeten, das ihr helfen würde, die Nutzung der Plattform besser zu verstehen, und Lindy reagierte in gleicher Weise – da wusste Crivello, dass etwas nicht stimmte. Es gibt kein Video-Tutorial.
„Wir haben das gesehen und dachten uns: ‚Okay, was für ein Video wurde gesendet?‘ und dann dachten wir: ‚Oh Mist, das ist ein Problem‘“, sagte Crivello gegenüber Tech.
Das Video, das die KI dem Kunden schickte, war das Musikvideo zu Rick Astleys Dance-Pop-Hit „Never Gonna Give You Up“ aus dem Jahr 1987. Oder besser gesagt: Der Kunde wurde rickrolled. Von einer KI.
Rickrolling ist ein Lockvogel-Meme, das über fünfzehn Jahre alt ist. In einem Vorfall, der das Meme populär machte, veröffentlichte Rockstar Games den vielbeachteten Trailer zu „Grand Theft Auto IV“ auf seiner Website, aber der Datenverkehr war so enorm, dass die Website abstürzte. Einige Leute hatten es geschafft, das Video herunterzuladen und auf anderen Websites wie YouTube zu posten, indem sie die Links teilten, damit die Leute den Trailer sehen konnten. Aber ein 4chan-Benutzer beschloss, einen Streich zu spielen und den Link zu Rick Astleys „Never Gonna Give You Up“ zu teilen. Siebzehn Jahre später spielen die Leute ihren Freunden immer noch Streiche, indem sie den Astley-Song in unpassenden Momenten teilen – jetzt hat das Musikvideo über 1,5 Milliarden Aufrufe auf YouTube.
Dieser Internet-Streich ist so allgegenwärtig, dass große Sprachmodelle wie ChatGPT, auf dem Lindy basiert, ihn zwangsläufig aufgegriffen haben.
„Diese Modelle funktionieren so, dass sie versuchen, die wahrscheinlichste nächste Textsequenz vorherzusagen“, sagte Crivello. „Es beginnt also mit: ‚Oh, ich schicke dir ein Video!‘ Was kommt danach am wahrscheinlichsten? YouTube.com. Und was kommt danach am wahrscheinlichsten?“
Crivello sagte gegenüber Tech, dass Lindy von Millionen von Antworten nur zweimal Kunden rickrollte. Trotzdem war es notwendig, den Fehler zu beheben.
„Das wirklich Bemerkenswerte an diesem neuen Zeitalter der KI ist, dass ich zum Patchen nur eine Zeile für das hinzufügen musste, was wir die Systemeingabeaufforderung nennen – das ist die Eingabeaufforderung, die in jedem Lindy enthalten ist – und die lautete etwa: ‚Rickrollt die Leute nicht‘“, sagte er.
Lindys Ausrutscher wirft die Frage auf, wie viel von der Internetkultur in KI-Modelle einfließen wird, da diese Modelle oft an großen Teilen des Internets trainiert werden. Lindys versehentlicher Rickroll ist besonders bemerkenswert, da die KI dieses sehr spezifische Nutzerverhalten, das ihre Halluzination beeinflusste, organisch reproduzierte. Aber Spuren von Internethumor sickern auch auf andere Weise in die KI ein, was Google auf die harte Tour lernen musste, als es Reddit-Daten lizenzierte, um seine KI zu trainieren. Als Knotenpunkt für benutzergenerierte Inhalte – von denen viele satirisch sind – sagte Googles KI einem Benutzer schließlich, dass man Käse besser am Pizzateig haften lassen könne, indem man Klebstoff hinzufügt.
„Im Fall Google war es nicht wirklich eine Erfindung“, sagte Crivello. „Es basierte auf Inhalten – nur waren die Inhalte schlecht.“
Da sich LLMs schnell verbessern, glaubt Crivello, dass wir in Zukunft nicht mehr so viele Pannen wie diese sehen werden. Außerdem, so Crivello, ist es einfacher denn je, diese Pannen zu beheben. In den Anfangstagen von Lindy sagte die KI, wenn einer der KI-Assistenten die vom Benutzer gewünschte Aufgabe nicht erledigen konnte, zwar, dass sie daran arbeite, lieferte das Produkt aber nie. (Komischerweise klingt das ziemlich menschlich.)
„Es war wirklich schwer für uns, dieses Problem zu beheben“, sagte Crivello. „Aber als GPT-4 herauskam, fügten wir einfach eine Eingabeaufforderung hinzu, die lautete: ‚Wenn der Benutzer Sie auffordert, etwas zu tun, was Sie nicht tun können, sagen Sie ihm einfach, dass Sie es nicht tun können.‘ Und das hat das Problem behoben.“
Die gute Nachricht ist, dass der Kunde, der Opfer eines Rickrolling-Angriffs geworden ist, möglicherweise nicht einmal davon weiß.
„Ich weiß nicht einmal, ob der Kunde es gesehen hat“, sagte er. „Wir haben sofort nachgefragt: ‚Oh, hey, das ist der richtige Link zum Video‘, und der Kunde hat zum ersten Link nichts gesagt.“