KI-Programm verblüfft Forscher — Unterhaltung

KI Programm verbluefft Forscher — Unterhaltung

Forscher waren verblüfft, nachdem das neueste Programm von OpenAI, einem Entwickler von Systemen für künstliche Intelligenz, anscheinend eine Sprache geschaffen hat, die nur es verstehen kann.

DALL-E2 ist ein selbstlernender Text-zu-Bild-Generator, der im Januar 2022 eingeführt wurde. Seine Hauptfunktion besteht darin, von Benutzern bereitgestellte Textaufforderungen zu verwenden und ein Bild zusammen mit Untertiteln zu erstellen, das zu den Wörtern passt.

Laut dem Informatik-Doktoranden Giannis Daras war eine der Einschränkungen von DALL-E2 jedoch die Fähigkeit, Text zu produzieren, da es nur unsinnige Wörter zurückgeben kann, wenn es dazu aufgefordert wird.

In einem im Wissenschaftsarchiv veröffentlichten Artikel ArxivAnfang dieses Monats lieferte Daras ein Beispiel für diese Einschränkung und erklärte, dass das Einspeisen des Programms mit der Eingabeaufforderung „Zwei Bauern sprechen über Gemüse mit Untertiteln“ ein Bild zurückgibt, das zwei Bauern zeigt, die miteinander sprechen, während sie etwas Gemüse in ihren Händen halten, aber der Text, der im Bild erscheint, scheint völliger Kauderwelsch zu sein.

Eine bekannte Einschränkung von DALLE-2 ist, dass es mit Text zu kämpfen hat. Die Eingabeaufforderung „Zwei Landwirte sprechen über Gemüse, mit Untertiteln“ ergibt beispielsweise ein Bild, das Kauderwelsch zu enthalten scheint. Allerdings ist der Text nicht so willkürlich, wie es zunächst den Anschein hat… (2/n) pic.twitter.com/B3e5qVsTKu

— Giannis Daras (@giannis_daras) 31. Mai 2022

Aber Forscher haben jetzt erkannt, dass hinter den scheinbar unverständlichen Worten des Programms noch viel mehr stecken könnte. „Wir haben festgestellt, dass diese produzierte Textausgabe nicht zufällig ist, sondern ein verborgenes Vokabular offenbart, das das Modell anscheinend intern entwickelt hat“, schrieb Daras.

Er lieferte auch ein weiteres Beispiel: Wenn man das Programm aufforderte, „ein Bild des Wortes Flugzeug“ zu erstellen, führte dies oft zu generierten Bildern, die Kauderwelsch-Text darstellten. Das Zurückgeben dieses Textes an die KI führte jedoch häufig zu Bildern von Flugzeugen.

Die Hypothese von Daras lautet, dass die KI anscheinend ihr eigenes Vokabular entwickelt und bestimmten Wörtern, die sie selbst hervorgebracht hat, eine Bedeutung zugewiesen hat, wie im Fall der Bauern, die über Gemüse und Vögel sprachen.

Aber obwohl es beeindruckend sein mag, scheint Daras von der Idee nicht besonders begeistert zu sein und sagt, dass, wenn er mit der Fähigkeit der KI, ihre eigene Sprache zu produzieren, richtig liegt, dies ernsthafte Sicherheitsherausforderungen für den Text-zu-Bild-Generator darstellen könnte .

„Das erste Sicherheitsproblem bezieht sich auf die Verwendung dieser Kauderwelsch-Eingabeaufforderungen als gegnerische Backdoor-Angriffe oder Möglichkeiten, Filter zu umgehen“, schrieb er in seinem Artikel. „Derzeit filtern Systeme zur Verarbeitung natürlicher Sprache Texteingabeaufforderungen, die gegen die Richtlinienregeln verstoßen, und Kauderwelsch-Eingabeaufforderungen können verwendet werden, um diese Filter zu umgehen.“

„Noch wichtiger ist, dass absurde Eingabeaufforderungen, die ständig Bilder erzeugen, unser Vertrauen in diese großen generativen Modelle in Frage stellen“, fügte er hinzu.

Allerdings muss Daras‘ Artikel noch begutachtet werden, und einige Forscher haben seine Ergebnisse in Frage gestellt, wobei einer feststellte, dass die KI nicht immer auf die beschriebene Weise zu funktionieren scheint.

Research Analyst Benjamin Hilton sagte, er habe den Generator gebeten, zwei Wale zu zeigen, die über Essen sprechen, mit Untertiteln. Zuerst konnte DALL-E2 keinen entschlüsselbaren Text zurückgeben, also machte der Forscher weiter, bis es endlich funktionierte.

Hilton erklärte, dass „‚Evve waeles‘ entweder Unsinn oder eine Verballhornung des Wortes ‚Wale‘ ist. Giannis hatte Glück, als seine Wale ‚Wa ch zod rea‘ sagten und das zufällig Bilder von Futter erzeugte.“ Er fügte hinzu, dass einige Ausdrücke wie „3D-Rendering“ oft völlig unterschiedliche Ergebnisse lieferten, was darauf hindeutet, dass sie nicht genau dasselbe bedeuten.

Nichtsdestotrotz gab Hilton zu, dass ein ordentlicher Peer-Review von Daras‘ Artikel viel mehr enthüllen könnte und bestand darauf, dass an seinen Behauptungen noch etwas dran sein könnte, da der Kauderwelsch-Ausdruck „Apoploe vesrreaitais“ immer wieder Bilder von Vögeln zurückgibt.

DALL-E2 ist nicht die erste KI, die Anzeichen für die Entwicklung einer Sprache zeigt, zuvor schien Google Translate AI, das ein neuronales Netzwerk verwendet, um zwischen einigen der beliebtesten Sprachen zu übersetzen, auch sein eigenes künstliches Vokabular erstellt zu haben, das es zum Übersetzen verwendete zwischen Sprachen, in denen es nicht explizit trainiert wurde.

Auch die KI von Facebook schien eine Form der internen Kommunikation entwickelt zu haben, nachdem zwei Chatbots anfingen, sich auf eine für Menschen völlig unverständliche Weise zu unterhalten. Tatsächlich kam es so schnell so weit voran, dass die Forscher beschlossen, den Stecker zu ziehen, bevor es sich weiter entwickeln konnte.

Die Programmierer von Facebook bestanden darauf, dass die KI-Bots Englisch sprechen sollten, damit andere Benutzer sie verstehen konnten, und stellten fest, dass Menschen niemals in der Lage sein würden, mit der Entwicklung einer KI-generierten Sprache Schritt zu halten.

:



rrt-unterhaltung