Auf der Entwicklerkonferenz Google I/O 2024 am Dienstag gab Google bekannt, dass es Gemini Nano, das kleinste seiner KI-Modelle, direkt in den Chrome-Desktop-Client einbauen wird, beginnend mit Chrome 126.
Dies, so das Unternehmen, werde es Entwicklern ermöglichen, das On-Device-Modell zu nutzen, um ihre eigenen KI-Funktionen zu betreiben. Google selbst plant, diese neue Funktion zu nutzen, um beispielsweise Funktionen wie das bestehende „Helfen Sie mir zu schreiben“-Tool von Workspace Lab in Gmail zu unterstützen.
Das Unternehmen gibt an, dass es die jüngsten Arbeiten zur WebGPU- und WASM-Unterstützung in Chrome sind, die es diesen Modellen ermöglichen, auf einer breiten Palette von Hardware mit angemessener Geschwindigkeit zu laufen.
In einem Briefing vor der Ankündigung am Dienstag wies Jon Dahlke, Googles Direktor für Produktmanagement für Chrome, darauf hin, dass Google mit anderen Browser-Anbietern verhandelt, um diese oder eine ähnliche Funktion auch in ihren Browsern zu aktivieren.
„Wir haben begonnen, uns mit anderen Browsern zu beschäftigen und werden ein frühes Vorschauprogramm für Entwickler eröffnen“, schrieb Dahlke in der Ankündigung vom Dienstag. „Da webGPU, WASM und Gemini in Chrome integriert sind, glauben wir, dass das Web KI-fähig ist. „
Ich bezweifle jedoch, dass die meisten Chrome-Konkurrenten ausschließlich auf die KI-Modelle von Google setzen wollen. Sinnvoller ist es, Browsern – und Entwicklern – die Möglichkeit zu geben, das Modell ihrer Wahl auszuführen. Google würde sich eindeutig dafür entscheiden, Gemini für seine Anwendungen zu verwenden, aber diese Modelle sind klein genug, um Entwicklern die Wahl zu ermöglichen, welches Modell sie für ihre Anwendungen verwenden möchten.
Die Wette von Google besteht jedoch darin, eine Reihe von High-Level-APIs in Chrome zu ermöglichen, um mithilfe seiner Gemini-Modelle Text im Browser zu übersetzen, zu beschriften und zu transkribieren.
„Um diese Funktion bereitzustellen, haben wir unsere effizienteste Version von Gemini verfeinert und Chrome optimiert“, sagte Dahlke während der heutigen Entwickler-Keynote auf der I/O. „Jetzt möchten wir Ihnen Zugriff auf Gemini-Modelle in Chrome ermöglichen. Unsere Vision ist es, Ihnen die leistungsfähigsten KI-Modelle in Chrome zur Verfügung zu stellen, um Milliarden von Nutzern zu erreichen, ohne sich um schnelle Entwicklung, Feinabstimmung, Kapazität und Kosten kümmern zu müssen. Alles, was Sie tun müssen, ist, ein paar High-Level-APIs aufzurufen – übersetzen, beschriften, transkribieren. Das ist eine große Veränderung für das Web und wir wollen es richtig machen.“
Für Entwickler nutzt Google jetzt auch das integrierte Gemini Nano-Modell, um einige neue Funktionen in der Chrome DevTools Console bereitzustellen. Dank dessen können die Chrome-Entwicklungstools nun Fehler erklären und Debugging-Lösungen direkt in der Konsole bereitstellen.
Wir starten einen KI-Newsletter! Melden Sie sich hier an, um es ab dem 5. Juni in Ihren Posteingängen zu erhalten.