Sitz in Seattle XetHubein Startup, das es Unternehmen erleichtert, Git für die Datenverwaltung zu verwenden, gab heute bekannt, dass es eine Seed-Finanzierungsrunde in Höhe von 7,5 Millionen US-Dollar unter der Leitung von Madonna. Die Grundidee hier ist, Entwicklern zu ermöglichen, mit Daten genauso zu arbeiten wie mit Code, einschließlich aller Funktionen für die Zusammenarbeit, die ein Tool wie Git ermöglicht. Das Team beschreibt XetHub als „kollaborative Speicherplattform für das Datenmanagement“.
Das Unternehmen wurde von Yucheng Low (CEO), Ajit Banerjee und Rajat Arya mitbegründet, einem Team mit jahrelanger Erfahrung in der Arbeit mit großen Datenplattformen. Tatsächlich war Low zuvor Mitbegründer des ML-Startups Turi, bei dem Arya der erste Mitarbeiter war. Apple erwarb das Unternehmen im Jahr 2016, wodurch Low und Arya an verschiedenen Teilen von Apples ML-Plattform-Stack arbeiten konnten, wobei Arya beispielsweise das Datenplattform-Team von Apple leitete. Bei Apple lernten die beiden auch Banerjee kennen, der zuvor bei Inktomi, Amazon und Facebook gearbeitet hatte. Zuvor hatte er auch zwei Startups gegründet.
Während der Arbeit an der Datenplattform bei Apple erkannte das Team, dass es im Bereich des Datenmanagements noch viel Raum für Verbesserungen gab.
„Es sollte wirklich nicht überraschen, aber Daten sind viel wichtiger als alles andere. Wichtiger als das Modell – als alles andere“, sagte Low. „Zu verwalten, wo Sie diese Daten speichern, wie Sie an diesen Daten zusammenarbeiten, ist wirklich grundlegend. Was wir jedoch sehen, ist, dass sich die Art und Weise, wie wir Daten heute verwalten, wirklich so anfühlt, wie Quellcode vor 30 Jahren erstellt wurde – was bedeutet, dass die Versionskontrolle oder Zusammenarbeit durch Kopieren und Einfügen erfolgt – manchmal gibt es eine ausgefeiltere Version davon, aber Letztendlich ist es immer noch Copy-and-Paste, wenn ich sicherstellen möchte, dass niemand sonst anfasst, was ich tue.“
So wie Entwickler auf Tools wie Git umgestiegen sind, um an ihrem Quellcode zusammenzuarbeiten, möchte XetHub ihnen ermöglichen, dieselben vertrauten Grundelemente für die Arbeit mit Daten zu verwenden.
„Wir denken darüber nach, dass wir es Entwicklern zum ersten Mal wirklich ermöglichen, mit Daten genauso zu arbeiten wie mit Code“, sagte Low. Er bemerkte, dass das Team darauf abzielte, ein Tool zu entwickeln, das nicht nur eine Git-ähnliche Erfahrung nachahmt, sondern eines, das die zentrale Git-Benutzererfahrung bewahrt – einschließlich aller Integrationen, mit denen Entwickler vertraut sind.
Derzeit kann der Dienst Repositories mit bis zu 1 TB an Daten verarbeiten, mit Plänen, diese bald auf 100 TB zu erweitern. Nur wenige Entwickler werden ein großes Repository wie dieses klonen wollen, daher ist eine raffinierte Funktion hier, dass Entwickler diese Repositorys auch mounten und sie sich wie ein lokales Dateisystem verhalten können, egal ob es sich auf ihrem Laptop oder einem großen GPU-Cluster befindet. Es ist auch erwähnenswert, dass das Tool unabhängig von Dateiformaten ist.
Aus Marketingsicht konzentriert sich das Team auf KI/ML-Teams, aber Benutzer können XetHub natürlich für die Verwaltung aller Arten von Daten verwenden.
Xethub ist jetzt mit einer kostenlosen Community-Edition öffentlich verfügbar, mit der Sie bis zu 20 GB deduplizierten Speicher verwalten können. Low sagt mir, dass das Unternehmen bereits mit einigen Unternehmenskunden spricht, aber das Team noch nicht ganz bereit ist, Namen zu nennen.
„Yucheng und das außergewöhnliche XetHub-Team haben seit weit über einem Jahrzehnt Innovationen mit maschinellem Lernen entwickelt und ihre Fähigkeiten dann bei dem bekanntesten Unternehmen für Verbrauchertechnologie – Apple – angewendet. XetHub ermöglicht es Entwicklern, in Zusammenarbeit mit anderen mit großen Datensätzen zu arbeiten, um intelligente und generative Anwendungen zu erstellen“, sagte Matt McIlwain, Managing Director, Madrona. „Die Entwicklung und Bereitstellung dieser Anwendungen wird durch veraltete Infrastrukturen und komplexe Daten-Workflows eingeschränkt, und XetHub befasst sich mit diesen Problempunkten aus Entwicklersicht.“