Am Dienstag stellte Google Gemini 2.5 vor, eine neue Familie von KI -Argumentationsmodellen, die vor der Beantwortung einer Frage „denken“.
Um die neue Modelsfamilie zu beginnen, startet Google Gemini 2.5 Pro Experimental, ein multimodales KI -Modell, das das Unternehmen behauptet, das intelligenteste Modell zu sein, das es bisher bisher ist. Dieses Modell wird am Dienstag auf der Entwicklerplattform des Unternehmens Google AI Studio sowie in der Gemini-App für Abonnenten des AI-Plans von 20 US-Dollar pro Monat erhältlich sein.
Laut Google werden alle neuen KI -Modelle Argumentationsfunktionen aufweisen.
Seit Openai im September 2024, O1, das erste KI -Argumentationsmodell gestartet hat, ist die Tech -Industrie gefahren, um die Fähigkeiten dieses Modells mit ihren eigenen zu entsprechen oder zu übertreffen. Heute verfügen Anthropic, Deepseek, Google und XAI über AI-Argumentationsmodelle, die durch Probleme mit zusätzlicher Rechenleistung und Zeit für Fakten und Vernunft vorhanden sind, bevor sie eine Antwort abgeben.
Argumentationstechniken haben AI -Modellen geholfen, neue Höhen bei Mathematik- und Codierungsaufgaben zu erreichen. Viele in der Tech -Welt glauben, dass Argumentationsmodelle ein wesentlicher Bestandteil von AI -Agenten sein werden, autonome Systeme, die Aufgaben hauptsächlich in San Human Intervention ausführen können. Diese Modelle sind jedoch auch teurer.
Google behauptet, dass Gemini 2.5 Pro seine früheren Frontier -KI -Modelle und einige der konkurrierenden KI -Modelle auf mehreren Benchmarks übertrifft. Insbesondere hat Google Gemini 2.5 so gestaltet, dass es sich um eine Excel -Erstellung von visuell überzeugenden Web -Apps und Agentencodierungsanwendungen erstellt.
Bei einer Bewertung der Bewertung der Code, die als Aider Polyglot bezeichnet wird, bewertet Google, dass Gemini 2.5 Pro 68,6%erzielt, und die Top -KI -Modelle von OpenAI, Anthropic und Chinese AI Lab Deekeek übertreffen.
Bei einem anderen Test-Mess-Software-Devility-Fähigkeiten verifizierte SWE-Bench jedoch, dass Gemini 2.5 Pro 63,8%bewertet, die O3-Mini und Deepseeks R1 übertreffen, aber die Claude 3.7-Sonnet von Anthropic, die 70,3%erzielte, unterdurchschnittlich unterdurchschnittlich.
In der letzten Prüfung der Menschheit – ein multimodaler Test mit Tausenden von Crowdsourcing -Fragen zu Mathematik, Geisteswissenschaften und Naturwissenschaften – sagt Google, dass Gemini 2.5 Pro 18,8%führte und führende KI -Modelle von OpenAI, Anthropic und Deepseek übertreffen.
Laut Google, sagt Google, versendet Gemini 2.5 Pro mit einem 1 -Million -Token -Kontextfenster, was bedeutet, dass das KI -Modell in einer einzigen Eingabeaufforderung ungefähr 750.000 Wörter aufnehmen kann. Das ist länger als der gesamte Buch der Lord of the Rings. Laut Google kommt jedoch ein 2 -Millionen -Token -Kontextfenster in Kürze.
Google hat bereits mit KI -Argumentationsmodellen experimentiert – zuvor im Dezember eine „Denken“ -Version von Gemini veröffentlicht -, aber Gemini 2.5 ist der bisher schwerwiegendste Konkurrent des Unternehmens, die die openai o -Serie von Modellen bisher zu sein.
Google hat die API -Preisgestaltung für Gemini 2.5 Pro nicht geteilt.