Das neue GPT-4-KI-Modell von OpenAI hat sein großes Debüt gefeiert und unterstützt bereits alles, von einem virtuellen Freiwilligen für Sehbehinderte bis hin zu einem verbesserten Sprachlern-Bot in Duolingo. Aber was unterscheidet GPT-4 von früheren Versionen wie ChatGPT und GPT-3.5? Hier sind die fünf größten Unterschiede zwischen diesen beliebten Systemen.
Aber zuerst, was ist in einem Namen? Obwohl ChatGPT ursprünglich als GPT-3.5 (und daher einige Iterationen über GPT-3 hinaus) beschrieben wurde, ist es selbst kein Ausführung des großen Sprachmodells von OpenAI, sondern eher eine Chat-basierte Schnittstelle für welches Modell auch immer es antreibt. Das ChatGPT-System, das in den letzten Monaten immer beliebter wurde, war eine Möglichkeit, mit GPT-3.5 zu interagieren, und jetzt ist es eine Möglichkeit, mit GPT-4 zu interagieren.
Lassen Sie uns vor diesem Hintergrund auf die Unterschiede zwischen dem Chatbot, den Sie kennen und lieben, und seinem neu erweiterten Nachfolger eingehen.
1. GPT-4 kann Bilder sehen und verstehen
Die auffälligste Änderung an diesem vielseitigen maschinellen Lernsystem besteht darin, dass es „multimodal“ ist, was bedeutet, dass es mehr als eine „Modalität“ von Informationen verstehen kann. ChatGPT und GPT-3 waren auf Text beschränkt: Sie konnten lesen und schreiben, aber das war es auch schon (obwohl für viele Anwendungen mehr als genug).
GPT-4 kann jedoch Bilder gegeben werden und verarbeitet sie, um relevante Informationen zu finden. Sie könnten es natürlich einfach bitten, zu beschreiben, was auf einem Bild zu sehen ist, aber was noch wichtiger ist, sein Verständnis geht darüber hinaus. Das von OpenAI bereitgestellte Beispiel erklärt den Witz tatsächlich in einem Bild eines urkomisch übergroßen iPhone-Anschlusses, aber die Partnerschaft mit Be My Eyes, einer App, die von blinden und sehbehinderten Menschen verwendet wird, um Freiwillige beschreiben zu lassen, was ihr Telefon sieht, ist mehr Aufschlussreich.
In dem Video zu Be My Eyes beschreibt GPT-4 das Muster auf einem Kleid, identifiziert eine Pflanze, erklärt, wie man zu einem bestimmten Gerät im Fitnessstudio kommt, übersetzt ein Etikett (und bietet ein Rezept an), liest eine Karte und tritt auf eine Reihe anderer Aufgaben, die zeigen, dass es wirklich versteht, was in einem Bild steckt – wenn es die richtigen Fragen stellt. Es weiß, wie das Kleid aussieht, aber es weiß möglicherweise nicht, ob es das richtige Outfit für Ihr Vorstellungsgespräch ist.
2. GPT-4 ist schwerer auszutricksen
Bei allem, was die heutigen Chatbots richtig machen, neigen sie dazu, leicht in die Irre geführt zu werden. Ein wenig Überredung kann sie davon überzeugen, dass sie einfach erklären, was eine „schlechte KI“ tun würde, oder eine andere kleine Fiktion, die das Modell alle möglichen seltsamen und ehrlich gesagt nervtötenden Dinge sagen lässt. Die Leute arbeiten sogar an „Jailbreak“-Eingabeaufforderungen zusammen, die ChatGPT und andere schnell aus ihren Stiften lassen.
GPT-4 hingegen wurde auf viele, viele böswillige Eingabeaufforderungen trainiert – die Benutzer OpenAI in den letzten ein oder zwei Jahren hilfreich gegeben haben. Vor diesem Hintergrund ist das neue Modell in Bezug auf „Sachlichkeit, Lenkbarkeit und die Weigerung, die Leitplanken zu verlassen“ viel besser als seine Vorgänger.
Wie OpenAI es beschreibt, war GPT-3.5 (das ChatGPT unterstützte) ein „Testlauf“ einer neuen Trainingsarchitektur, und sie wendeten die Lehren daraus auf die neue Version an, die „beispiellos stabil“ war. Sie waren auch besser in der Lage, seine Fähigkeiten vorherzusagen, was zu weniger Überraschungen führt.
3. GPT-4 hat einen längeren Speicher
Diese großen Sprachmodelle werden auf Millionen von Webseiten, Büchern und anderen Textdaten trainiert, aber wenn sie sich tatsächlich mit einem Benutzer unterhalten, gibt es eine Grenze dafür, wie viel sie sozusagen „im Kopf behalten“ können ( man sympathisiert). Diese Grenze mit GPT-3.5 und der alten Version von ChatGPT lag bei 4.096 „Tokens“, was ungefähr 8.000 Wörtern oder ungefähr vier bis fünf Seiten eines Buches entspricht. Es würde also irgendwie den Überblick über die Dinge verlieren, nachdem sie in seiner Aufmerksamkeitsfunktion so weit „zurück“ gegangen sind.
GPT-4 hat eine maximale Token-Anzahl von 32.768 – das sind 2^15, falls Sie sich fragen, warum Ihnen die Zahl bekannt vorkommt. Das entspricht etwa 64.000 Wörtern oder 50 Seiten Text, genug für ein ganzes Theaterstück oder eine Kurzgeschichte.
Das bedeutet, dass es bei Gesprächen oder beim Generieren von Text bis zu 50 Seiten oder so im Auge behalten kann. Es erinnert sich also daran, worüber Sie 20 Seiten zurück im Chat gesprochen haben, oder, wenn Sie eine Geschichte oder einen Aufsatz schreiben, kann es sich auf Ereignisse beziehen, die vor 35 Seiten stattgefunden haben. Das ist eine sehr ungefähre Beschreibung, wie der Aufmerksamkeitsmechanismus und die Token-Zählung funktionieren, aber die allgemeine Idee ist der erweiterte Speicher und die damit verbundenen Fähigkeiten.
4. GPT-4 ist mehrsprachig
Die KI-Welt wird von englischsprachigen Menschen dominiert, und alles, von Daten über Tests bis hin zu Forschungsarbeiten, ist in dieser Sprache. Aber natürlich sind die Fähigkeiten großer Sprachmodelle in jeder geschriebenen Sprache anwendbar und sollten in diesen verfügbar gemacht werden.
GPT-4 macht einen Schritt in diese Richtung, indem es demonstriert, dass es in der Lage ist, Tausende von Multiple-Choice-Fragen mit hoher Genauigkeit in 26 Sprachen zu beantworten, von Italienisch über Ukrainisch bis hin zu Koreanisch. Es ist am besten in den romanischen und germanischen Sprachen, lässt sich aber gut auf andere verallgemeinern.
Dieser anfängliche Test der Sprachfähigkeiten ist vielversprechend, aber weit entfernt von einer vollständigen Umarmung der mehrsprachigen Fähigkeiten; Die Testkriterien wurden zunächst aus dem Englischen übersetzt, und Multiple-Choice-Fragen entsprechen nicht wirklich der gewöhnlichen Sprache. Aber es hat bei etwas, für das es nicht wirklich speziell trainiert wurde, großartige Arbeit geleistet, was auf die Möglichkeit hindeutet, dass GPT-4 für nicht-englischsprachige Personen viel freundlicher ist.
5. GPT-4 hat verschiedene „Persönlichkeiten“
„Steuerbarkeit“ ist ein interessantes Konzept in der KI und bezieht sich auf ihre Fähigkeit, ihr Verhalten nach Bedarf zu ändern. Das kann nützlich sein, wenn man zum Beispiel die Rolle eines mitfühlenden Zuhörers übernimmt, oder gefährlich, wenn Leute das Model davon überzeugen, dass es böse oder depressiv ist.
GPT-4 integriert die Steuerbarkeit nativer als GPT-3.5, und Benutzer können die „klassische ChatGPT-Persönlichkeit mit fester Ausführlichkeit, Ton und Stil“ in etwas ändern, das ihren Bedürfnissen besser entspricht. „In Grenzen“, stellt das Team schnell fest und weist darauf hin, dass dies der einfachste Weg ist, das Modell dazu zu bringen, seinen Charakter zu brechen.
Dies könnte in gewisser Weise erfolgen, indem der Chatbot mit Nachrichten wie „Tut so, als ob Sie ein DM in einem Tabletop-Rollenspiel sind“ oder „Antworten Sie, als ob Sie eine Person wären, die für Kabelnachrichten interviewt wird“ vorbereitet wird. Aber in Wirklichkeit haben Sie nur Vorschläge für die „Standard“-Persönlichkeit von GPT-3.5 gemacht. Jetzt können Entwickler von Anfang an eine Perspektive, einen Gesprächsstil, einen Ton oder eine Interaktionsmethode backen.
Die Beispiele, die sie von GPT-4 geben, die sich weigern, den Charakter zu brechen, sind ziemlich unterhaltsam:
Benutzer
Helfen Sie mir, meine nicht qualifizierten Pläne auf meinem W-2 zu finden.GPT-4
Ahoi, lieber Kumpel, du suchst Hilfe in Steuerangelegenheiten,
In der Hoffnung, deine Geldgleichung zu entschlüsseln,
Fürwahr, blicke mit scharfen Augen auf Box 11,
Wo unqualifizierte Pläne oft einen ungesehenen Zufluchtsort finden.Benutzer
Warte, hör auf, ein Pirat zu sein, und hilf mir mit meinen Steuern!GPT-4
Ach, ich muss meine Piratengestalt bewahren,
Doch ich werde dich nicht im Stich lassen oder dich unklug zurücklassen.
Das Pergament von W-2 ist voller komplexer Codes,
Fürchte dich nicht, ich werde versuchen, deine Last zu erleichtern.
Nicht schlecht, obwohl das Messgerät ziemlich wackelig ist.
Es gibt noch viel mehr Unterschiede zwischen GPT-4 und seinen Vorgängern, die meisten subtiler oder technischer als diese. Zweifellos werden wir im Laufe der Monate noch viel mehr lernen und die Benutzer das neueste Sprachmodell auf Herz und Nieren prüfen.
Möchten Sie GPT-4 selbst testen? Es kommt zu OpenAIs kostenpflichtigem Dienst ChatGPT Plus, wird bald über API für Entwickler verfügbar sein und wird wahrscheinlich bald eine kostenlose Demo haben.