PlanetScale verzweigt MySQL, um Vektorunterstützung hinzuzufügen

PlanetScale verzweigt MySQL um Vektorunterstuetzung hinzuzufuegen

Es scheint, als ob jeder in der Datenbankbranche darüber nachdenkt, wie er vom Wachstum der KI profitieren kann, indem er seinen Produkten Unterstützung für Vektoren hinzufügt. Dies ist schließlich nach wie vor die einfachste Möglichkeit, aktuelle Daten in Basismodelle einzuspeisen. Fast 28 Jahre nach seiner Einführung mag MySQL nicht mehr viel Hype um sich haben, aber es bleibt eine der am häufigsten genutzten Datenbanken und betreibt den Großteil des Webs. Heute, PlanetScaledas gut finanzierte MySQL-Datenbankunternehmen, das von den Mitschöpfern des gegründet wurde Vitess Das Open-Source-Projekt gab bekannt, dass es MySQL forken wird, um Vektorunterstützung hinzuzufügen – teilweise weil das Team glaubt, dass MySQL-Eigentümer Oracle nicht schnell genug vorgeht, um dasselbe zu tun.

„MySQL ist immer noch die weltweit beliebteste Datenbank; betreibt immer noch 70 % des Internets. „Oracle hat nur langsam auf diese sich verändernde und sich weiterentwickelnde Welt der KI reagiert und im Allgemeinen wird das moderne MySQL von PlanetScale weitergeführt“, sagte mir Sam Lambert, CEO und Präsident von PlanetScale, als ich ihn fragte, warum sich das Unternehmen für diesen Weg entschieden habe. „Was wir anhand der Branchentrends gesehen haben, ist, dass KI nicht nur zu einem Anstieg der Vektordaten, sondern auch der relationalen Daten selbst führt. Die Leute haben proprietäre Daten, sie haben die Eingaben, die für diese Modelle verwendet werden, und dann entsteht diese Art kreisförmiger Rückkopplungsschleife: Sie sehen, wonach die Leute suchen, Sie geben das in Ihre relationale Datenbank ein, und dann Wenn Sie darauf trainieren, speichern Sie Vektoren und führen eine Ähnlichkeitssuche durch. Wir konnten uns von der mangelnden Geschwindigkeit von Oracle in dieser Hinsicht nicht wirklich abhängig machen.“

Lambert bemerkte, dass sein Team nur etwa sechs Wochen brauchte, um die Arbeit an der Hinzufügung der Vektorunterstützung abzuschließen. Das Team testet derzeit, um sicherzustellen, dass seine Lösung skalierbar ist, bevor sie allen PlanetScale-Benutzern zur Verfügung gestellt wird. Das Unternehmen prüft jedoch auch, ob es diesen Code vorab in die MySQL-Open-Source-Edition einbringen kann. „Wir werden versuchen, dies zu verbessern, um gute Bürger zu sein“, sagte Lambert, der 2021 zu PlanetScale kam, nachdem er VP of Engineering bei GitHub war. „Wir glauben an Open Source. Durch meinen Hintergrund bei GitHub konnte ich sehr viel Erfahrung in der Open-Source-Community sammeln, wir lieben Open Source.“

Intern nutzt PlanetScale seit Jahren einen MySQL-Fork, daher ist das Unternehmen mit der Wartung dieses Forks bestens vertraut, muss dies nun aber öffentlich tun. Und obwohl es dem Team schnell gelang, Vektorunterstützung zu MySQL hinzuzufügen, argumentiert Lambert, dass dies nur möglich war, weil das Team mit den Interna der Datenbank bestens vertraut war. „Das ist keine Kleinigkeit, oder? Es handelt sich um eine 25 Jahre alte C++-Codebasis, oder? Postgres hat jetzt zwei Versionen davon, weil sie über ein einfaches Plugin-Ökosystem verfügen. Das ist viel Arbeit, die wir leisten mussten, um dies tatsächlich zu produzieren – und es zahlt sich aus.“

Bildnachweis: Planetenskala

Das Wertversprechen von PlanetScale bestand zu einem großen Teil schon immer darin, dass das Unternehmen weit über alle Mitbewerber hinaus skalieren kann. Vitess kam schließlich von YouTube. Das Unternehmen verspricht nun, diese Skalierbarkeit auf Vektordatenbanken und die Suche übertragen zu können. Lambert argumentiert, dass es sinnvoll ist, die Vektormerkmale in der Nähe der Datenbank zu halten. Seiner Ansicht nach ist das Speichern von Vektoren keine sehr komplizierte Methode zum Speichern von Daten, daher ist es einfach genug, sie der vorhandenen Datenbank hinzuzufügen und die beiden Systeme nah beieinander zu halten. Dies bedeutet nun auch, dass im Idealfall bald auch WordPress und andere Tools, die auf MySQL laufen, einfachen Zugriff auf diese Funktionen erhalten, was es den Entwicklern in diesen Ökosystemen ermöglichen würde, KI-basierte Funktionen, die benutzerdefinierte Funktionen nutzen, einfacher hinzuzufügen auch Daten.

„Wir glauben, dass es ein zentraler Teil unserer Mission ist“, sagte Lambert. „Wenn wir das moderne MySQL weiterführen würden, müssten wir die Flagge hochhalten und es uns zu eigen machen und vorankommen. Wir freuen uns sehr darüber, MySQL weiter zu verbessern, während sich dieses neue moderne Publikum in es verliebt.“

„Es ist großartig, dass MySQL so zuverlässig ist. Niemand stellt es in Frage. Niemand hat jemals gesagt, dass es nicht zuverlässig und nicht skalierbar ist. Das gibt Oracle nicht die Entschuldigung, die Lieferungen einzustellen und auf diese Trends zu reagieren, und deshalb sind wir hier, deshalb greifen wir das auf.“

tch-1-tech