Startup zur Datentransformation Tobiko ist vielleicht noch kein bekannter Name, aber Sie haben vielleicht Mitbegründer und CEO gesehen Tyson Mao bei „Beauty and the Geek“ in den Nullerjahren und sein Mitgründer, Bruder und CTO Toby Maoauf der Speedcubing-Tour. (Beide haben in der Vergangenheit Weltrekorde gehalten, und Tyson war Mitbegründer der World Cube Association.) Seitdem haben die Brüder zusammen mit ihrem Mitbegründer Iaroslav Zeigerman hat bei einer großen Bandbreite von Unternehmen gearbeitet, von Apple über Airbnb bis hin zu Google und Netflix, wo sich Tyson und Zeigerman zum ersten Mal trafen.
Mit Tobiko wollen sie nun die Arbeit von Teams mit Daten neu definieren, indem sie eine dbt-kompatibel Datentransformationsplattform mit dem beliebten SQLMesh Und SQLGlot Open-Source-Projekte im Kern und eine intuitive Low-Code-Benutzeroberfläche zum Erstellen von Datenpipelines und -transformationen.
Das Unternehmen startet am Dienstag seine Cloud-Plattform und gibt eine Finanzierung von insgesamt 21,8 Millionen US-Dollar bekannt, aufgeteilt auf eine Seed-Runde von 4,5 Millionen US-Dollar und eine von Theory Ventures geleitete Serie-A-Runde von 17,3 Millionen US-Dollar. 20Sales, Fivetran-CEO George Fraser, Census-CEO Boris Jabes und MotherDuck-CEO Jordan Tigani investierten ebenfalls in das Unternehmen.
Während seiner Zeit bei Airbnb leitete Toby das Unternehmen Minerva-Projektdie semantische Ebene für interne Metriken des Unternehmens. Während er daran arbeitete, wurde ihm jedoch klar, dass die wahre Stärke von Minerva nicht in der Semantik, sondern in den Möglichkeiten zur Datentransformation lag.
„Die Schritte von den Rohdaten zum tatsächlichen Geschäftswert – da passiert eine Menge“, sagte er mir. „Es ist viel harte Arbeit. Deshalb wollten wir irgendwann ein Semantikunternehmen gründen, aber zuerst wollten wir die Transformation bewältigen. Und so bekam ich bei Airbnb eine Demo der branchenüblichen Tools dbt, und das gab mir die Inspiration, damit anzufangen.“
Toby würdigte die Popularität und Funktionalität von dbt, das zu einer Art Industriestandard für den Aufbau geworden ist. Er argumentierte jedoch, dass es nicht für jedes Unternehmen die richtige Lösung sei. „DBT wurde wirklich entwickelt, um die Datenstapel von Unternehmen der Serie A zu beschleunigen“, sagte er. „Wir wollten eine Datenplattform erstellen, ein Datentransformationstool, das in jedem Unternehmen funktionieren kann, sogar im FAANG-Stil. Also nutzten wir unsere Erfahrung, unser kollektives Wissen und bauten ein System, das sowohl mit großen Datenmengen als auch mit vielen Mitarbeitern skalierbar ist.“
Wie Zeigerman erklärte, ist SQLMesh das Herzstück dieser modernen Plattform, ein Open-Source-Tool, mit dem Entwickler Datenpipelines mit integrierten Tools für Datentransformation, Tests und Zusammenarbeit erstellen können. Hier kommt auch der semantische Hintergrund des Teams ins Spiel. „SQLMesh versteht SQL, anstatt es als Textstück zu behandeln“, erklärte er. Und dieses Verständnis kommt von SQLGlot, das Toby während seiner Zeit bei Airbnb entwickelt hat. „Diese Fähigkeit, SQL zu verstehen, setzt eine Reihe von Dingen frei, die die Geschwindigkeit der Entwicklung und die Produktivität der Ingenieure erheblich steigern.“
Mit diesem Tool konnte Tobiko beispielsweise die Syntax von SQL-Abfragen überprüfen, bevor diese an die Datenbank gesendet wurden. Außerdem werden alle Änderungen, die Ingenieure im Entwicklungsprozess vornehmen, kategorisiert und verfolgt und es wird ihnen mitgeteilt, ob sie im Hinblick auf andere Datensätze und Transformationen im System zu Problemen führen.
„Wir sind überzeugt, dass dies eines der ersten Beobachtungstools sein wird, das nicht nur erkennt, dass etwas kaputt ist, sondern auch, warum es kaputt ist. Denn wir verstehen Ihren Code, wir verstehen jede Version jedes Codes, den Sie jemals geschrieben haben, und wir können jeden Fehler mit dieser Änderung in Verbindung bringen“, sagte Tyson.
Tobiko bietet Unternehmen außerdem die Möglichkeit, sogenannte „virtuelle Datenumgebungen“ zu erstellen, die Entwickler während der Entwicklungsphase nutzen und dann für andere Projekte (oder sogar in der Produktion) wiederverwenden können.
Das Team sagt mir, dass es sich derzeit hauptsächlich an Datentechnikteams richtet und mit Kunden aller Größen zusammenarbeitet, darunter auch einige Unicorn-Startups. Viele von ihnen bringen völlig neue Anwendungen in den Dienst ein, aber da er mit dbt kompatibel ist, gibt es auch eine Reihe von dbt-Benutzern, die den Wechsel vorgenommen haben.