Google hat ein sogenanntes neues „logisches“ KI-Modell veröffentlicht – es befindet sich jedoch noch im experimentellen Stadium, und unsere kurzen Tests zeigen, dass es sicherlich Raum für Verbesserungen gibt.
Das neue Modell mit dem Namen Gemini 2.0 Flash Thinking Experimental (natürlich ein Bissen) ist in AI Studio, der KI-Prototyping-Plattform von Google, verfügbar. Eine Modellkarte beschreibt es als „am besten geeignet für multimodales Verstehen, Denken und Codieren“ mit der Fähigkeit, „über die komplexesten Probleme nachzudenken“ in Bereichen wie Programmierung, Mathematik und Physik.
In einem Post Auf X bezeichnete Logan Kilpatrick, Produktleiter für AI Studio, Gemini 2.0 Flash Thinking Experimental als „den ersten Schritt in die Zukunft.“ [Google’s] Argumentationsreise.“ Jeff Dean, Chefwissenschaftler von Google DeepMind, der KI-Forschungsabteilung von Google, sagte in seinem eigenen Beitrag, dass Gemini 2.0 Flash Thinking Experimental „trainiert ist, Gedanken zu nutzen, um seine Argumentation zu stärken“.
„Wir sehen vielversprechende Ergebnisse, wenn wir die Inferenzberechnungszeit erhöhen“, sagte Dean und bezog sich dabei auf den Rechenaufwand, der zum „Ausführen“ des Modells bei der Prüfung einer Frage erforderlich ist.
Es ist noch eine frühe Version, aber sehen Sie sich an, wie das Modell ein anspruchsvolles Rätsel mit visuellen und textlichen Hinweisen bewältigt: (2/3) pic.twitter.com/JltHeK7Fo7
— Logan Kilpatrick (@OfficialLoganK) 19. Dezember 2024
Gemini 2.0 Flash Thinking Experimental basiert auf Googles kürzlich angekündigtem Gemini 2.0 Flash-Modell und scheint im Design dem o1 von OpenAI und anderen sogenannten Reasoning-Modellen zu ähneln. Im Gegensatz zu den meisten KI-Modellen überprüfen Argumentationsmodelle die Fakten effektiv selbst und können so einige der Fallstricke vermeiden, die KI-Modelle normalerweise zum Stolpern bringen.
Ein Nachteil besteht darin, dass Argumentationsmodelle oft länger brauchen – in der Regel Sekunden bis Minuten länger –, um zu Lösungen zu gelangen.
Bei einer Aufforderung hält Gemini 2.0 Flash Thinking Experimental inne, bevor es antwortet, berücksichtigt eine Reihe verwandter Aufforderungen und „erklärt“ dabei die Argumentation. Nach einer Weile fasst das Modell die seiner Meinung nach genaueste Antwort zusammen.
Nun ja – genau das soll passieren. Als ich Gemini 2.0 Flash Thinking Experimental fragte, wie viele Rs das Wort „Erdbeere“ habe, hieß es „zwei“.
Ihr Kilometerstand kann variieren.
Im Zuge der Veröffentlichung von o1 kam es zu einer Explosion von Argumentationsmodellen konkurrierender KI-Labore – nicht nur von Google. Anfang November veröffentlichte DeepSeek, ein von Quant-Tradern finanziertes KI-Forschungsunternehmen, eine Vorschau seines ersten Argumentationsmodells, DeepSeek-R1. Im selben Monat stellte das Qwen-Team von Alibaba den angeblich ersten „offenen“ Herausforderer von o1 vor.
Bloomberg gemeldet Im Oktober berichtete Google, dass mehrere Teams Argumentationsmodelle entwickelten. Nachfolgend Berichterstattung Die im November veröffentlichten Informationen ergaben, dass das Unternehmen über mindestens 200 Forscher verfügt, die sich auf die Technologie konzentrieren.
Was hat die Schleusen des Argumentationsmodells geöffnet? Nun, zum einen die Suche nach neuartigen Ansätzen zur Weiterentwicklung der generativen KI. Wie kürzlich mein Kollege Max Zeff gemeldet„Brute Force“-Techniken zur Skalierung von Modellen führen nicht mehr zu den Verbesserungen, die sie früher hatten.
Nicht jeder ist davon überzeugt, dass Argumentationsmodelle der beste Weg nach vorne sind. Zum einen sind sie aufgrund der großen Rechenleistung, die für ihren Betrieb erforderlich ist, tendenziell teuer. Und während sie es getan haben durchgeführt gut drauf Maßstäbe Bisher ist nicht klar, ob Argumentationsmodelle dieses Fortschrittstempo aufrechterhalten können.
Tech hat einen KI-fokussierten Newsletter! Melden Sie sich hier an um es jeden Mittwoch in Ihrem Posteingang zu erhalten.