Diese KI nutzte GPT-4, um ein erfahrener Minecraft-Spieler zu werden

Diese KI nutzte GPT 4 um ein erfahrener Minecraft Spieler zu werden

KI-Forscher haben einen Minecraft-Bot gebaut, der seine Fähigkeiten in der offenen Welt des Spiels erkunden und erweitern kann – aber im Gegensatz zu anderen Bots hat dieser im Grunde seinen eigenen Code durch Versuch und Irrtum geschrieben und viele von GPT-4-Anfragen.

Dieses experimentelle System namens Voyager ist ein Beispiel für einen „verkörperten Agenten“, eine KI, die sich in einer simulierten oder realen Umgebung frei und zielgerichtet bewegen und agieren kann. KIs und Chatbots vom Typ „Persönliche Assistenten“ müssen nicht unbedingt Dinge tun, geschweige denn durch eine komplexe Welt navigieren, um diese Dinge zu erledigen. Aber das ist genau das, was von einem Haushaltsroboter in Zukunft erwartet werden könnte, daher gibt es viele Untersuchungen darüber, wie sie das tun könnten.

Minecraft ist ein guter Ort, um solche Dinge zu testen, weil es eine sehr (sehr) ungefähre Darstellung der realen Welt ist, mit einfachen und unkomplizierten Regeln und Physik, aber auch komplex und offen genug, dass es viel zu erreichen oder auszuprobieren gibt. Speziell entwickelte Simulatoren sind ebenfalls großartig, haben aber ihre eigenen Einschränkungen.

MeinDojo ist ein auf Minecraft basierendes Simulations-Framework, da man nicht einfach eine zufällige KI hineinstecken und erwarten kann, dass sie versteht, was all diese Blöcke und Schweine tun. Seine Macher (viele Überschneidungen mit dem Voyager-Team) haben unter anderem YouTube-Videos über das Spiel, Transkripte, Wiki-Artikel und eine ganze Reihe von Reddit-Beiträgen von r/minecraft zusammengestellt, damit Benutzer ein KI-Modell erstellen oder verfeinern können auf sie. Dadurch können diese Modelle auch mehr oder weniger objektiv bewertet werden, indem man sieht, wie gut sie Dinge wie den Bau eines Zauns um ein Lama oder das Finden und Schürfen eines Diamanten beherrschen.

Voyager ist bei diesen Aufgaben hervorragend und schneidet viel besser ab als das einzige andere Modell, das dem nahe kommt: AutoGPT. Aber sie verfolgen einen ähnlichen Ansatz: Sie verwenden GPT-4, um unterwegs ihren eigenen Code zu schreiben.

Normalerweise trainiert man ein Modell einfach mit all diesen guten Minecraft-Daten und hofft, dass es herausfindet, wie man Skelette bekämpft, wenn die Sonne untergeht. Voyager beginnt jedoch relativ naiv, und wenn es im Spiel auf Dinge stößt, führt es ein kleines internes Gespräch mit GPT-4 darüber, was es tun soll und wie.

Die nächste Aktion anweisen und Fertigkeiten zum Stapel hinzufügen.

Nehmen wir zum Beispiel an, die Nacht bricht herein und diese Skelette kommen zum Vorschein. Der Agent hat eine allgemeine Vorstellung davon, fragt sich aber: Was würde ein guter Spieler dieses Spiels tun, wenn Monster in der Nähe sind? Nun, GPT-4 sagt, wenn Sie die Welt sicher erkunden wollen, sollten Sie ein Schwert herstellen und ausrüsten und dann das Skelett damit schlagen, ohne dabei getroffen zu werden. Und dieser allgemeine Sinn dafür, was zu tun ist, wird in konkrete Ziele umgesetzt: Steine ​​und Holz sammeln, am Basteltisch ein Schwert bauen, es ausrüsten und gegen ein Skelett kämpfen.

Sobald diese Dinge erledigt sind, werden sie in eine allgemeine Fertigkeitsbibliothek eingetragen, sodass sie später, wenn die Aufgabe lautet: „Gehe tief in eine Höhle, um Eisenerz zu finden“, das Kämpfen nicht noch einmal von Grund auf erlernen muss. Es verwendet immer noch GPT, aber das günstigere und schnellere GPT-3.5, das ihm die Fähigkeiten mitteilt, die für eine bestimmte Situation am relevantesten sind – es versucht also nicht, das Skelett abzubauen und das Erz zu bekämpfen.

Es ähnelt einem Agenten wie AutoGPT: Wenn er mit einer Schnittstelle konfrontiert wird, die er noch nicht kennt, muss er sich selbst beibringen, darin zu navigieren, um sein Ziel zu erreichen. Aber Minecraft ist eine viel tiefere Umgebung, als es normalerweise zu lösen ist, daher schneidet ein Spezialagent wie Voyager weitaus besser ab. Er findet mehr Dinge, erlernt mehr Fähigkeiten und erkundet ein viel größeres Gebiet als die anderen Bots.

Interessanterweise, aber vielleicht nicht überraschend, wischt GPT-4 GPT-3.5 (dh ChatGPT) den Garaus, wenn es darum geht, nützlichen Code zu generieren. Bei einem Test, bei dem Ersteres durch Letzteres ersetzt wurde, stieß der Agent früh an eine Wand, vielleicht sogar im wahrsten Sinne des Wortes, und konnte sich nicht verbessern. Wenn man mit den beiden Models spricht, ist es vielleicht nicht offensichtlich, dass eines davon viel schlauer ist, aber die Wahrheit ist, dass man nicht besonders schlau sein muss, um ein scheinbar intelligentes Gespräch zu führen (fragen Sie mich, woher ich das weiß). Das Codieren ist viel schwieriger und GPT-4 war dort ein großes Update.

Bei dieser Forschung geht es nicht darum, Minecraft-Spieler zu veralten, sondern darum, Methoden zu finden, mit denen sich relativ einfache KI-Modelle auf der Grundlage ihrer „Erfahrungen“ verbessern können, da es kein besseres Wort dafür gibt. Wenn wir Roboter haben wollen, die uns in unseren Häusern, Krankenhäusern und Büros helfen, müssen sie lernen und diese Lektionen auf künftige Maßnahmen anwenden.

Mehr über Voyager können Sie hier lesen.

tch-1-tech