Gemini könnte Googles große Chance sein, es mit Microsoft und OpenAI aufzunehmen

Google plant, im Herbst sein KI-Grundlagenmodell der nächsten Generation namens Gemini auf den Markt zu bringen. Gemini ist in der Lage, Konversationstexte und Bilder zu generieren, ähnlich dem GPT-4-Sprachmodell von OpenAI, und wird laut The Information in seinen Chatbot Bard und Apps wie Google Docs und Slide integriert. Der Schritt erfolgt, da Konkurrenten wie Microsoft, das die OpenAI-Technologie in Office 365-Apps integriert hat, und die GPT-4- und DALL-E-Modelle von OpenAI die Möglichkeiten fortschrittlicher KI demonstrieren.

Um die Entwicklung großer Sprachmodelle wie Gemini zu beschleunigen, hat Google zwei separate KI-Teams unter dem CEO zusammengelegt Sundar Pichai früher in diesem Jahr. Unter ihnen sind Paul Barham, ein leitender Google-Forscher, Tom Hennigan von DeepMind, der für die Infrastruktur von Gemini verantwortlich ist, und Google-Mitbegründer Sergey Brin. Der Mitbegründer von Google übernimmt die Leitung des KI-Plans des Unternehmens
Quellen zufolge war Sergey Brin zunehmend an den KI-Fortschritten von Google beteiligt, einschließlich der Entwicklung von Google Bard, einem ChatGPT-Konkurrenten. Er nahm an weiteren KI-Meetings im Hauptquartier von Mountain View teil und arbeitete mit einem Forscherteam am mit Spannung erwarteten KI-Modell Gemini zusammen. Brin war auch aktiv an wöchentlichen Diskussionen über neue KI-Forschung und Personalentscheidungen beteiligt.Während der diesjährigen I/O sagte Google, dass sich Gemini noch in der Schulung befinde. Ziel ist es, bei der Tool- und API-Integration hocheffizient zu sein und zukünftige Innovationen wie Speicher und Planung zu ermöglichen. Außerdem wurden multimodale Fähigkeiten beobachtet, die die der Vorgängermodelle übertreffen. Sobald Gemini fein abgestimmt und auf Sicherheit getestet wurde, wird es in verschiedenen Größen und Fähigkeiten erhältlich sein, sagte das Unternehmen. Mitarbeiter diskutieren bereits über die möglichen Anwendungen von Gemini, darunter die Analyse von Diagrammen und die Erstellung von Grafiken mit Textbeschreibungen sowie die Steuerung von Software per Text oder Sprachbefehlen. Google setzt auf Gemini, um eine breite Palette von Diensten zu betreiben, vom Bard-Chatbot bis hin zu Unternehmens-Apps, und möchte diese auch Entwicklern über Google Cloud anbieten. Auf diese Weise hofft Google, bei der Bereitstellung von KI-Funktionen für Apps besser mit Microsoft Azure konkurrieren zu können und gleichzeitig Verbraucherprodukte wie Bard zu entwickeln.



Ende des Artikels

gn-tech