Mit Datasaur können Sie automatisch ein Modell aus einer Reihe von Beschriftungen erstellen

Lange bevor die Leute über ChatGPT und generative KI sprachen, mochten Unternehmen Datensaurier beschäftigten sich mit den Grundlagen der Erstellung von Modellen für maschinelles Lernen und halfen dabei, Dinge zu kennzeichnen, um das Modell zu trainieren. Mit dem Aufschwung der KI ist diese Art von Fähigkeit sogar noch wichtiger geworden.

Um die Modellerstellung mehr Unternehmen ohne einen Data-Science-Spezialisten zugänglich zu machen, kündigte Datasaur die Möglichkeit an, ein Modell direkt aus den Etikettendaten zu erstellen, wodurch die Modellerstellung einem viel weniger technisch versierten Publikum zugänglich gemacht wird. Außerdem wurde eine Seed-Verlängerung in Höhe von 4 Millionen US-Dollar angekündigt, die im vergangenen Dezember abgeschlossen wurde.

Firmengründer Ivan Lee sagt, dass der jüngste Anstieg des KI-Interesses für das Unternehmen großartig war und tatsächlich gut zur Strategie des Startups passt. „Datasaur hat immer danach gestrebt, der beste Ort zu sein, um die Trainingsdaten zu sammeln, die Sie in Ihre Modelle einspeisen müssen, egal ob es sich um LLMs oder traditionelle NER-Modelle, Stimmungsanalysen oder was auch immer handelt“, sagte Lee gegenüber Tech.

„Wir sind einfach die beste Schnittstelle für diese technisch nicht versierten Benutzer, um diese Daten zu kennzeichnen“, sagte er.

Der Aufstieg von LLMs trägt dazu bei, das Bewusstsein dafür zu schärfen, wie KI im Geschäftskontext hilfreich sein kann. Er sagt jedoch, dass sich die meisten Unternehmen noch in der Erkundungsphase befinden und immer noch Produkte wie Datasaur zum Erstellen von Modellen benötigen. Lee sagt, eines seiner Ziele sei von Anfang an gewesen, die KI zu demokratisieren, insbesondere im Bereich der Verarbeitung natürlicher Sprache, und die neue Modellbildungsfunktion soll die KI für mehr Unternehmen zugänglich machen, auch für solche ohne spezielles Fachwissen.

„Und ich freue mich besonders über diese Funktion, weil sie es Teams ohne Datenwissenschaftler und ohne Ingenieure ermöglicht, diese Daten einfach so zu markieren und zu kennzeichnen, wie sie es für richtig halten, und es wird einfach automatisch ein Modell für sie trainiert“, sagte Lee.

Lee sieht darin eine Möglichkeit, über den ursprünglichen Zielmarkt der Datenwissenschaftler hinauszugehen. „Jetzt werden wir es für Baufirmen, Anwaltskanzleien und Marketingfirmen öffnen, die vielleicht keinen Data-Engineering-Hintergrund haben, aber dennoch NLP-Modelle erstellen können [based on their training data].“

Er sagt, er sei in der Lage gewesen, die Höhe der von ihm getätigten Risikoinvestitionen zu begrenzen – der bisherige Startwert belief sich im Jahr 2020 auf bescheidene 3,9 Millionen US-Dollar –, weil er schlank wirtschafte. Sein Engineering-Team befindet sich größtenteils in Indonesien, und obwohl er damit rechnet, neue Mitarbeiter einzustellen, ist er stolz darauf, das Unternehmen effizient zu führen.

„Meine Philosophie war schon immer: Rentabilität, skalierbares Wachstum und niemals Wachstum um jeden Preis“, sagte Lee. Das bedeutet, dass er jede Einstellung und die Auswirkungen, die sie auf das Unternehmen haben wird, berücksichtigt.

Durch eine ortsunabhängige, interkulturelle Belegschaft können die Mitarbeiter voneinander lernen, und das bringt naturgemäß Vielfalt in das Unternehmen. „Es gibt einen erheblichen Unterschied in der Arbeitsplatzkultur zwischen den USA und der Arbeitsweise in Indonesien. Deshalb mussten wir darauf achten, das Beste aus beiden Welten einzufangen“, sagte er. Das könnte bedeuten, indonesische Kollegen zu ermutigen, sich zu Wort zu melden oder sich zu widersetzen, was ein Manager sagt, was sie kulturell ungern tun. „Wir haben dies sehr proaktiv gefördert“, sagte er.

Aber er sagt, dass US-Mitarbeiter auch eine Menge darüber lernen können, wie die Dinge in Asien funktionieren, etwa Respekt vor den Kollegen und diese Kultur, bei der das Team an erster Stelle steht, und er musste den Teams helfen, diese kulturellen Unterschiede zu bewältigen.

Die 4-Millionen-Dollar-Investition wurde von Initialized Capital unter Beteiligung von HNVR, Gold House Ventures und TenOneTen geleitet. Das Unternehmen hat insgesamt 7,9 Millionen US-Dollar eingesammelt.

tch-1-tech