Google veranstaltet diese Woche eine Version seiner Cloud Next-Konferenz in Tokio und legt den Schwerpunkt auf die Optimierung seiner Datenbanken für KI-Workloads (denn zu diesem Zeitpunkt im Jahr 2024 ist KI das einzige, worüber diese großen Technologieunternehmen sprechen wollen). Dazu gehören Aktualisierungen seiner Spanner SQL-Datenbank, die jetzt Graph- und Vektorsuchunterstützung sowie erweiterte Volltextsuchfunktionen bietet.
Dies wäre keine Google-Ankündigung ohne einige Gemini-basierte Funktionen. Dazu gehören Gemini in BigQuery und Looker, um Benutzer bei der Datentechnik und -analyse sowie bei Governance- und Sicherheitsaufgaben zu unterstützen.
Google argumentiert, dass die überwiegende Mehrheit der Unternehmen zwar der Ansicht sei, dass generative KI für ihren Geschäftserfolg von entscheidender Bedeutung sei, ihnen jedoch auch bewusst sei, dass ein Großteil ihrer Daten unverwaltet bleibe und somit außerhalb des Rahmens ihrer Analyse- und KI-Initiativen liege.
„Sie müssen wirklich aus all ihren bestehenden Datensilos und Dateninseln herauskommen und zu einer konsolidierten multimodalen Datenplattform gelangen, die strukturierte und unstrukturierte Daten umfasst — [because] „GenAI ist hervorragend darin, unstrukturierte Daten zu analysieren – und ruhende Daten mit ihrer Datenbewegung zu kombinieren, also Echtzeitdaten und ruhende Datenverarbeitung“, erklärte Gerrit Kazmaier, Googles Vizepräsident und General Manager für Datenbanken, Datenanalyse und Looker. Er argumentierte, dass es bei vielen dieser neuen Funktionen darum gehe, diesen Unternehmensdatenfluss zu aktivieren.
Spanner erhält Grafik- und Vektorfunktionen
Spanner ist die Basis für die meisten Google-Produkte wie Search, Gmail und YouTube. Zu den Kunden zählen Unternehmen wie Home Depot, Uber, Walmart und andere. Spanner kann zwar riesige Datenmengen verarbeiten, aber Vektor- und Graphdatenbanken sind unverzichtbar, um Unternehmensdaten in GenAI-Anwendungen zu integrieren und vorhandene Basismodelle zu erweitern.
„Wir überlegen, was wir wirklich brauchen, um Spanners Verfügbarkeit, Skalierbarkeit und relationales Modell zu nutzen und es wirklich zur besten Datenplattform für operative GenAI-Apps auszubauen“, sagte Andi Gutmans, Googles Vizepräsident und General Manager für Datenbanken. Wie so viele Datenbankanbieter besteht der erste Schritt für Google darin, Spanner mit Graphenfunktionen auszustatten, indem der aufkommende GraphQL-Standard verwendet wird. Unternehmen können diesen Graphen dann verwenden, um ihre GenAI-Anwendungen – und die zugrunde liegenden Basismodelle – mithilfe von Retrieval Augmented Generation (RAG) zu erweitern, was derzeit der De-facto-Standard für diesen Anwendungsfall ist.
Ebenfalls neu in Spanner sind die Volltextsuche und die Vektorsuche, wobei die Vektorsuchfunktionen durch den ScaNN-Algorithmus von Google unterstützt werden. „Mit Spanner Graph, Volltextsuche und Vektorsuche haben wir Spanner von der am besten verfügbaren, global konsistentesten und skalierbarsten Datenbank zu einer Multimodelldatenbank mit intelligenten Funktionen weiterentwickelt, die nahtlos zusammenarbeiten, um Ihnen die Bereitstellung einer neuen Klasse von KI-gestützten Anwendungen zu ermöglichen“, sagt Google.
Zusätzlich zu diesen KI-zentrierten Updates erhält Spanner eine neue, optionale Preisstruktur. Die Idee dahinter, die „Spanner-Editionen“, besteht darin, ein stufenbasiertes Preismodell anzubieten, das ihnen mehr Flexibilität bietet. Derzeit mussten Google Cloud-Kunden zwischen einem Angebot für eine einzelne Region und einer Version für mehrere Regionen wählen, die auch ein Bündel zusätzlicher Funktionen wie Replikation bot.
Bigtable wird SQL
Google kündigte am Donnerstag außerdem ein umfangreiches Update für Bigtable an, Googles NoSQL-Datenbank für unstrukturierte Daten und latenzempfindliche Workloads. Bigtable bietet jetzt SQL-Unterstützung (oder genauer gesagt Unterstützung für GoogleSQL, den unternehmenseigenen SQL-Dialekt), was die Nutzung des Dienstes für praktisch jeden Entwickler erheblich vereinfacht.
Bisher mussten Entwickler die Bigtable-API verwenden, um ihre Datenbanken abzufragen. Derzeit unterstützt Bigtable etwa 100 SQL-Funktionen.
Oracle auf Google Cloud
Für die Fans der Oracle-Datenbanken da draußen: Google ermöglicht es ihnen nun, ihre Oracle Exadata- und Autonomous-Datenbankdienste direkt in den Rechenzentren der Google Cloud zu hosten – und sie können ihre Anwendungen zwischen der Google Cloud und der Oracle Cloud verknüpfen. Für Google bedeutet das mehr Workloads in seiner Cloud und für Oracle zumindest bedeutet es, dass diese Benutzer weiterhin ihre Lizenzgebühren zahlen, auch wenn sie die Oracle Cloud nicht nutzen.
Ebenfalls neu in Google Cloud ist die Unterstützung für Open Source Apache Spark und Kafka für Datenstreaming und -verarbeitung sowie Echtzeitstreaming vom Analytics Hub (Googles Dienst für den sicheren Datenaustausch zwischen Organisationen).