Databricks übernimmt Tabular, um einen gemeinsamen Data-Lakehouse-Standard aufzubauen

Databricks, der Analytik- und KI-Riese, hat das Datenmanagementunternehmen Tabular für eine nicht genannte Summe übernommen. (CNBC berichtet, dass Databricks bezahlt über 1 Milliarde US-Dollar.)

Nach Tabular-Mitbegründer Ryan Blue und die beiden anderen Mitbegründer von Tabular, Daniel Weeks und Jason Reid, werden in irgendeiner Funktion zu Databricks wechseln. Dort werden sie daran arbeiten, die Kundenstämme und Communities von Tabular und Databrick zu vereinen.

„Der Beitritt zu Databricks bedeutet, dass es mehr Beiträge von unseren neuen Kollegen geben wird“, schreibt Blue in einem Blogbeitrag. „Dabei stellen wir sicher, dass unser Ansatz für [our community] ändert sich nicht.“

Tabular, das 2021 von Blue, Weeks und Reid gegründet wurde, bietet Datenverwaltungsprodukte auf Basis von Apache Iceberg, einem Projekt, das Blue und Weeks bei Netflix entwickelten und später der Apache Software Foundation spendeten. Iceberg ist ein Open-Source-Hochleistungsformat für Datenbanken, das Tabellen in Datenbanken für Big Data optimiert und es gleichzeitig Daten-Engines ermöglicht, mit den Tabellen zu arbeiten.

Iceberg konkurrierte mit Databricks‘ Delta Lake im Formatkrieg um Data Lakehouses – Datenarchitekturen, die große Mengen Rohdaten speichern und gleichzeitig Struktur- und Verwaltungsfunktionen bereitstellen. Obwohl sowohl Iceberg als auch Delta Lake das Datenspeicherformat Apache Parquet verwenden, sind sie in wichtigen Aspekten inkompatibel.

Bald jedoch werden Delta Lake und Iceberg zu einem einzigen System verschmelzen. Databricks und Tabular versprechen, im Lichte der Übernahmenachrichten auf einen gemeinsamen Standard hinzuarbeiten.

„[We will be] „Wir arbeiten daran, die Iceberg-Unterstützung auf der gesamten Databricks-Plattform zu verbessern“, sagte Blue. „Unser Ziel ist es, die Interoperabilität zu verbessern, damit Sie von der großartigen Arbeit beider Communities profitieren können und sich keine Gedanken über das zugrunde liegende Format machen müssen.“

Der Markt für Data Lakehouses ist riesig — nach Laut MIT Tech Review haben etwa 74 % der Organisationen eine solche Lösung – und so war die Aufnahme von Tabular in die Unternehmensfamilie aus Sicht von Databricks wahrscheinlich die klare Entscheidung. Weniger konkurrierende Data-Lakehouse-Formate – oder alternativ Plattformen mit starker Unterstützung für mehrere Formate – machen die Plattform von Databricks für Unternehmenskunden schließlich attraktiver, selbst wenn diese Formate nicht herstellerspezifisch sind.

In einem Blogeintrag Databricks, das von Ali Ghodsi, dem CEO von Databricks, und Reynold Xin, dem Chefarchitekten, gemeinsam verfasst wurde, erklärt, dass das Unternehmen beabsichtige, „eng mit den Iceberg- und Delta Lake-Communitys zusammenzuarbeiten“, um „Interoperabilität in die Formate selbst zu bringen“.

„Diese Übernahme unterstreicht unser Engagement für offene Formate und Open-Source-Daten in der Cloud“, heißt es in dem Blogbeitrag. „Dies ist ein langer Weg, der wahrscheinlich mehrere Jahre dauern wird, bis wir ihn erreichen.“ [the data lakehouse] Gemeinschaften.“

Vor der Übernahme hatte das in San Jose ansässige Unternehmen Tabular 37 Millionen Dollar Risikokapital von Investoren wie Andreessen Horowitz, Zetta Venture Partners und Altimeter Capital eingesammelt. Databricks rechnet damit, dass der Kauf irgendwann im zweiten Quartal 2024 abgeschlossen wird, vorbehaltlich der üblichen Abschlussbedingungen.

tch-1-tech