Laut Parallel Domain wird autonomes Fahren ohne synthetische Daten nicht skalieren • Tech

Laut Parallel Domain wird autonomes Fahren ohne synthetische Daten nicht

Um sicher autonomes Fahren zu erreichen, sind nahezu endlose Stunden an Schulungssoftware für jede möglicherweise auftretende Situation erforderlich, bevor ein Fahrzeug auf die Straße gebracht wird. In der Vergangenheit haben Autonomieunternehmen Horden von Daten aus der realen Welt gesammelt, mit denen sie ihre Algorithmen trainieren konnten, aber es ist unmöglich, ein System zu trainieren, wie es mit Grenzfällen allein auf der Grundlage von Daten aus der realen Welt umgeht. Nicht nur das, es ist auch zeitaufwändig, all diese Daten überhaupt zu sammeln, zu sortieren und zu kennzeichnen.

Die meisten Unternehmen für selbstfahrende Fahrzeuge wie Cruise, Waymo und Waabi verwenden synthetische Daten zum Trainieren und Testen von Wahrnehmungsmodellen mit einer Geschwindigkeit und einem Grad an Kontrolle, der mit Daten aus der realen Welt unmöglich ist. Parallele Domäneein Startup, das eine Datengenerierungsplattform für Autonomieunternehmen aufgebaut hat, sagt, dass synthetische Daten eine entscheidende Komponente sind, um die KI zu skalieren, die Seh- und Wahrnehmungssysteme antreibt, und sie auf die Unvorhersehbarkeit der physischen Welt vorzubereiten.

Das Startup hat gerade eine Serie B im Wert von 30 Millionen US-Dollar abgeschlossen, angeführt von March Capital, mit Beteiligung der Rückkehrinvestoren Costanoa Ventures, Foundry Group, Calibrate Ventures und Ubiquity Ventures. Parallel Domain konzentriert sich auf den Automobilmarkt und liefert synthetische Daten an einige der großen OEMs, die fortschrittliche Fahrerassistenzsysteme bauen, und an Unternehmen für autonomes Fahren, die viel fortschrittlichere Selbstfahrsysteme entwickeln. Laut Mitbegründer und CEO Kevin McNamara ist Parallel Domain jetzt bereit, auf Drohnen und mobile Computervision zu expandieren.

„Wir verdoppeln uns auch wirklich auf generative KI-Ansätze für die Generierung von Inhalten“, sagte McNamara gegenüber Tech. „Wie können wir einige der Fortschritte in der generativen KI nutzen, um eine viel größere Vielfalt an Dingen, Menschen und Verhaltensweisen in unsere Welt zu bringen? Denn der schwierige Teil hier ist wirklich, sobald Sie einen physikalisch genauen Renderer haben, wie bauen Sie eigentlich die Millionen verschiedener Szenarien auf, denen ein Auto begegnen muss?

Laut McNamara möchte das Startup auch ein Team einstellen, um seinen wachsenden Kundenstamm in Nordamerika, Europa und Asien zu unterstützen.

Aufbau einer virtuellen Welt

Eine Probe der synthetischen Daten von Parallel Domain. Bildnachweis: Parallele Domäne

Als Parallel Domain im Jahr 2017 gegründet wurde, konzentrierte sich das Startup stark darauf, virtuelle Welten auf der Grundlage von Kartendaten aus der realen Welt zu schaffen. In den letzten fünf Jahren hat Parallel Domain seine Weltgeneration erweitert, indem es sie mit Autos, Menschen, verschiedenen Tageszeiten, Wetter und all den verschiedenen Verhaltensweisen gefüllt hat, die diese Welten interessant machen. Dies ermöglicht Kunden – zu denen Parallel Domain zählt Google, Continental, Woven Planet und Toyota Research Institute – um dynamische Kamera-, Radar- und Lidar-Daten zu generieren, die sie benötigen würden, um ihre Sicht- und Wahrnehmungssysteme tatsächlich zu trainieren und zu testen, sagte McNamara.

Die synthetische Datenplattform von Parallel Domain besteht aus zwei Modi: Training und Test. Beim Training beschreiben Kunden hochrangige Parameter – zum Beispiel Autobahnfahrt mit 50 % Regen, 20 % nachts und einem Krankenwagen in jeder Sequenz –, auf denen sie ihr Modell trainieren möchten, und das System generiert Hunderttausende von Beispielen dazu diese Parameter erfüllen.

Auf der Testseite bietet Parallel Domain eine API, die es dem Kunden ermöglicht, die Platzierung dynamischer Dinge in der Welt zu steuern, die dann an ihren Simulator angeschlossen werden können, um bestimmte Szenarien zu testen.

Waymo zum Beispiel ist besonders daran interessiert, synthetische Daten zu verwenden, um auf verschiedene Arten zu testen Wetterverhältnisse, teilte das Unternehmen Tech mit. (Haftungsausschluss: Waymo ist kein bestätigter Parallel Domain-Kunde.) Waymo sieht das Wetter als eine neue Linse, die es auf alle Meilen anwenden kann, die es in der realen Welt und in der Simulation gefahren ist, da es unmöglich wäre, sich an all diese Erfahrungen mit beliebigem Wetter zu erinnern Bedingungen.

Ob es sich um Tests oder Schulungen handelt, wann immer die Software von Parallel Domain eine Simulation erstellt, ist sie in der Lage, automatisch Labels zu generieren, die jedem simulierten Agenten entsprechen. Dies hilft Teams für maschinelles Lernen, überwachtes Lernen und Testen durchzuführen, ohne den mühsamen Prozess der Kennzeichnung von Daten selbst durchlaufen zu müssen.

Parallel Domain stellt sich eine Welt vor, in der Autonomieunternehmen synthetische Daten für die meisten, wenn nicht alle ihrer Schulungs- und Testanforderungen verwenden. Heute variiert das Verhältnis von synthetischen zu realen Daten von Unternehmen zu Unternehmen. Etablierte Unternehmen mit den historischen Ressourcen, um viele Daten gesammelt zu haben, verwenden synthetische Daten für etwa 20 % bis 40 % ihres Bedarfs, während sich Unternehmen, die sich früher in ihrem Produktentwicklungsprozess befinden, zu 80 % auf synthetische gegenüber 20 % der realen Welt verlassen. nach McNamara.

Julia Klein, Partnerin bei March Capital und jetzt Vorstandsmitglied von Parallel Domain, sagte, sie glaube, dass synthetische Daten in der Zukunft des maschinellen Lernens eine entscheidende Rolle spielen werden.

„Das Erhalten der realen Daten, die Sie zum Trainieren von Computer-Vision-Modellen benötigen, ist oft ein Hindernis, und es gibt Verzögerungen, wenn es darum geht, diese Daten einzugeben, sie zu kennzeichnen und sie an eine Position zu bringen, an der sie tatsächlich sein können verwendet“, sagte Klein gegenüber Tech. „Was wir bei Parallel Domain gesehen haben, ist, dass sie diesen Prozess erheblich beschleunigen und sich auch mit Dingen befassen, die Sie möglicherweise nicht einmal in Datensätzen der realen Welt erhalten.“

tch-1-tech