Scale AI steigt in das synthetische Datenspiel ein – Tech

FarmRaise zielt darauf ab ein Finanzdienstleistungsriese zu werden beginnend mit

Der Weg von Scale AI zu einem 7,3-Milliarden-Dollar-Unternehmen war mit echten Daten aus Bildern, Text, Sprache und Video gepflastert. Jetzt nutzt es diese Grundlage, um in das synthetische Datenspiel einzusteigen, eine der heißesten und aufstrebenden Kategorien in der KI.

Sie kündigten am Mittwoch ein Early-Access-Programm an Skala Synthetik, ein Produkt, das Ingenieure für maschinelles Lernen verwenden können, um ihre vorhandenen Datensätze aus der realen Welt zu verbessern, so das Unternehmen. Scale stellte zwei Führungskräfte ein, um diesen neuen Geschäftsbereich aufzubauen. Scale stellte Joel Kronander, der zuvor das maschinelle Lernen bei Nines leitete und ein ehemaliger Computer-Vision-Ingenieur bei Apple war, der an 3D-Kartierung arbeitete, als neuen Leiter für synthetische Daten ein. Das Unternehmen stellte außerdem Vivek Raju Muppalla als Direktor für synthetische Dienstleistungen ein. Muppalla war zuvor Director of Engineering für KI und Simulation bei Unity Technologies.

Synthetische Daten sind, wie es sich anhört: gefälschte Daten, die von maschinellen Lernalgorithmen erstellt wurden, anstatt Informationen aus der realen Welt zu verwenden. Es kann ein leistungsstarkes und praktisches Werkzeug zum Generieren von Daten sein – wie medizinische Bildgebung – wenn der Datenschutz ein wichtiges Anliegen ist. Entwickler können synthetische Daten verwenden, um ihre Trainingsmodelle komplexer zu machen und Verzerrungen zu beseitigen, die häufig in gesammelten Datensätzen aus der realen Welt zu finden sind.

Skalieren Sie anfänglich kombinierte Software mit echten Bildern, Text-, Sprach- und Videodaten, die von Menschen gekennzeichnet wurden, um Unternehmen autonomer Fahrzeuge die gekennzeichneten Daten bereitzustellen, die zum Trainieren von Modellen für maschinelles Lernen für die Entwicklung und Bereitstellung von Robotaxis, selbstfahrenden Lastwagen und automatisierten Bots erforderlich sind Lieferung verlangen. Das Startup hat sich seitdem zu einem Unternehmen für Datenmanagementplattformen mit Kunden aus den Bereichen Regierung, Finanzen, E-Commerce, autonome Fahrzeuge und Unternehmen entwickelt.

Gründer und CEO Alexandr Wang beschrieb sein neues Angebot als einen hybriden Ansatz für Daten, ähnlich wie im Labor gezüchtetes Fleisch.

„Wir beginnen mit echten Daten, genau wie Fleisch aus dem Labor aus echten tierischen Zellen entsteht, und bauen dann das Produkt von dort aus an, iterieren und bauen es“, sagte er gegenüber Tech. Durch die Verwendung von Daten aus der realen Welt als Grundlage für die Erstellung synthetischer Daten sei das Unternehmen in der Lage, seinen Kunden ein wirklich einzigartiges und leistungsstarkes Angebot anzubieten, sagte Wang und fügte hinzu, dass dies eine Marktlücke sei, die sie gesehen hätten.

Scale-Kunden sahen diese Lücke ebenfalls. Der Vorstoß des Unternehmens in synthetische Daten sei eine Reaktion auf die Nachfrage seiner Kunden, sagte Wang gegenüber Tech, die sagten, sie hätten vor weniger als einem Jahr mit der Entwicklung des Produkts begonnen. Kodiak Robotics, Entwickler autonomer Fahrzeugtechnologie, Tractable AI und das US-Verteidigungsministerium haben Scale für ihr neues synthetisches Datenprodukt angezapft, sagte Wang.

Scale, das heute rund 450 Mitarbeiter beschäftigt, betrachtet synthetische Daten als oberste Priorität im Jahr 2022 und als einen Bereich, in den es beim Ausbau seiner Produktlinie weiter investieren wird. Aber das bedeutet nicht, dass es sein eigentliches Datengeschäft übernehmen wird. Wang sieht synthetische Daten als ein ergänzendes Werkzeug, das Entwicklern helfen wird, „mehr aus ihren Algorithmen und anderer KI herauszuholen, insbesondere in Grenzfällen.

Beispielsweise verwenden Unternehmen für autonome Fahrzeuge in der Regel Simulationen, um Szenarien aus der realen Welt nachzubilden und durchzuspielen, um zu sehen, wie das autonome System damit umgehen wird. Aber reale Daten liefern möglicherweise nicht das Szenario, nach dem sie suchen.

„In der realen Welt trifft man nicht allzu oft auf Szenarien, in denen beispielsweise 100 Radfahrer gleichzeitig die Straße überqueren“, erklärte Wang. „Wir können mit realen Daten beginnen und dann alle Radfahrer oder alle Menschen synthetisch hinzufügen, und auf diese Weise können Sie den Algorithmus richtig trainieren.“

tch-1-tech