Cloudera, das einst erfolgreiche Hadoop-Startup, sammelte 1 Milliarde US-Dollar und ging 2018 an die Börse, bevor es 2021 von einer Private-Equity-Gesellschaft für 5,3 Milliarden Dollar übernommen wurde. Heute gab das Unternehmen die Übernahme von Verta bekannt, einem KI-Startup, das Kunden bei der Verwaltung von Modellen des maschinellen Lernens unterstützt, darunter auch große Sprachmodelle, die in der generativen KI verwendet werden.
Cloudera, das im Jahr nach der Übernahme ein SaaS-Data-Lakehouse auf den Markt brachte, brauchte einiges an KI-Know-how, um auf dem heutigen Markt bestehen zu können. Cloudera-CEO Charles Sansbury war sich dessen durchaus bewusst.
„Die Zukunft des Datenmanagements ist KI; sie gehen Hand in Hand. Cloudera erwirbt Vertas Operational-AI-Plattform, um unser Team zu stärken und unsere operativen KI-Fähigkeiten zu beschleunigen“, sagte er in einer Erklärung.
Da Unternehmen immer stärker auf große Sprachmodelle umsteigen, hat sich Verta von einer aufgabenbasierten Modellverwaltungsplattform zu einer Plattform entwickelt, die stärker auf die Verwaltung der heutigen großen Sprachmodelle ausgerichtet ist und als Kontrollzentrum für die Modelle fungiert.
In einer Zeit, in der es schwierig ist, hochqualifizierte KI-Talente zu finden, erhält Cloudera durch diese Übernahme auch einige erstklassige Mitarbeiter, die dabei helfen, die KI-Tools zu betreiben und zu erweitern. Dazu gehören die Mitbegründer und CEO Manasi Vartak, die ihre ersten Erfahrungen am MIT CSAIL sammelte, und CTO Conrado Miranda, der einst bei Twitter für maschinelles Lernen verantwortlich war.
Verta wurde 2018 gegründet und sammelte fast 16 Millionen Dollar ein. pro Pitchbook. Dazu gehörte eine Serie A im Wert von 10 Millionen US-Dollar im Jahr 2020. Vartak entwickelte bereits während ihres Studiums die Open-Source-Datenbank ModelDB, um Versionen von Maschinenmodellen zu verfolgen. Später erweiterte sie diese Idee zu Verta.
Cloudera wurde 2008 als Hadoop-Startup gegründet, als Unternehmen gerade erst darüber nachdachten, wie sie große Datenmengen verarbeiten könnten. Hadoop, ein Open-Source-Projekt, das ursprünglich 2005 bei Yahoo entwickelt wurde, war einst die modernste Methode, dies zu tun. Das Problem war, dass es zum Zeitpunkt des Börsengangs des Unternehmens einfachere und kostengünstigere Möglichkeiten zur Verarbeitung dieser Daten gab und Hadoop an Schwung verlor.
Gleichzeitig verlagerten Unternehmen einen Großteil ihrer Daten-Workloads in die Cloud, sei es die drei großen Cloud-Anbieter – Amazon, Microsoft oder Google – oder Startups wie Snowflake und Databricks. Trotz des Namens waren die Lösungen von Cloudera während des Großteils ihrer Existenz tatsächlich vor Ort.
Der Schritt, 2021 ein SaaS-Data-Lakehouse aufzubauen, war teilweise ein Versuch, mit ihren Cloud-nativen Konkurrenten zu konkurrieren. Seitdem haben sowohl Databricks als auch Snowflake KI-Funktionen sowohl organisch als auch durch Akquisitionen hinzugefügt.
Bei dem heutigen Schritt geht es wirklich darum, mit den Nachbarn mitzuhalten.