Der neue Simulator von Waymo hilft Forschern, realistischere Agenten zu trainieren

Der neue Simulator von Waymo hilft Forschern realistischere Agenten zu

Hersteller autonomer Fahrzeuge nutzen Simulatoren, um ihre selbstfahrenden Systeme zu trainieren und ihnen beizubringen, wie sie auf „Agenten“ reagieren sollen – Dinge wie Fußgänger, Radfahrer, Ampeln und andere Autos. Um über ein wirklich fortschrittliches AV-System zu verfügen, müssen sich diese Agenten realistisch gegenüber dem AV-System und untereinander verhalten und reagieren.

Die Entwicklung und Schulung intelligenter Agenten ist eines der Probleme, die Waymo zu lösen versucht, und es ist eine häufige Herausforderung in der Welt der AV-Forschung. Zu diesem Zweck hat Waymo am Donnerstag einen neuen Simulator für die AV-Forschungsgemeinschaft auf den Markt gebracht, der eine Umgebung zum Trainieren intelligenter Agenten bietet, komplett mit vorgefertigten Sim-Agenten und einer Fülle von Waymo-Wahrnehmungsdaten.

„Herkömmliche Simulatoren haben oft vordefinierte Agenten, also hat jemand das Skript geschrieben, wie sich der Agent verhalten soll, aber das ist nicht unbedingt das, was er verhält“, sagte Drago Anguelov, Forschungsleiter bei Waymo, gegenüber Tech während eines Videointerviews.

„In unserem Fall wird dieser Simulator mit einem großen Datensatz unserer Fahrzeuge gepaart, der beobachtet, wie sich jeder in der Umgebung verhält. Wie viel können wir durch die Beobachtung, wie sich jeder verhält, darüber lernen, wie wir uns verhalten sollten? Wir nennen dies eine stärkere Nachahmungskomponente und sie ist der Schlüssel zur Entwicklung robuster, skalierbarer AV-Systeme.“

Waymo sagt, der Simulator sei synchronisiert Waymaxist „leichtgewichtig“, um Forschern eine schnelle Iteration zu ermöglichen. Unter Leichtgewicht versteht man, dass die Simulation nicht vollständig mit realistisch aussehenden Agenten und Straßen ausgestattet ist. Es zeigt vielmehr eine grobe Darstellung eines Straßendiagramms und die Agenten werden als Begrenzungsrahmen mit bestimmten integrierten Attributen dargestellt. Es handelt sich im Grunde um eine aufgeräumtere Umgebung, die es Forschern ermöglicht, sich mehr auf komplexe Verhaltensweisen bei mehreren Verkehrsteilnehmern zu konzentrieren als auf die Art und Weise, wie Agenten arbeiten und die Umgebung sieht aus, sagt Anguelov.

Bildnachweis: Waymo

Der Simulator ist jetzt verfügbar auf GitHub eine kommerzielle Nutzung ist jedoch nicht möglich. Vielmehr ist es Teil der größeren Initiative von Waymo, Forschern Zugang zu Tools wie diesem zu ermöglichen Offener Waymo-Datensatz – das kann dazu beitragen, die Entwicklung autonomer Fahrzeuge zu beschleunigen.

Waymo sagt, dass es die Arbeit, die Forscher mit Waymax erstellen, nicht einsehen kann, aber das bedeutet nicht, dass das zu Alphabet gehörende AV-Unternehmen nicht von der Weitergabe seiner Tools und Daten profitieren könnte.

Waymo veranstaltet regelmäßig Herausforderungen für Forscher, um bei der Lösung AV-relevanter Probleme zu helfen. Im Jahr 2022 organisierte das Unternehmen einen solchen Wettbewerb mit dem Namen „Simulated Agents“. Waymo bestückte einen Simulator mit Agenten und beauftragte Forscher damit, ihnen beizubringen, sich im Verhältnis zu seinem Testfahrzeug realistisch zu verhalten. Während die Herausforderung im Gange war, stellte Waymo fest, dass die Umgebung nicht stabil genug war, um die Agenten zu schulen. Deshalb hat Waymo mit Google Research zusammengearbeitet, um gemeinsam eine geeignetere Umgebung zu entwickeln, die in einem geschlossenen Regelkreis laufen kann oder in der das Verhalten des Systems kontinuierlich überwacht und optimiert wird, um aussagekräftige Ergebnisse zu erzielen.

So kam Waymo zu Waymax.

Anguelov sagt, Waymo werde diese Herausforderung wahrscheinlich nächstes Jahr mit dem neuen Simulator wiederholen. Diese Art von Herausforderungen ermöglichen es dem Unternehmen, zu sehen, wie weit die AV-Branche bei bestimmten Problemen – wie Multi-Agent-Umgebungen – fortgeschritten ist, und zu sehen, wie die Technologie von Waymo im Vergleich abschneidet.

„Der Waymo Open Dataset und diese Simulatoren sind unsere Möglichkeit, die akademische oder Forschungsdiskussion in Richtungen zu lenken, die wir für vielversprechend halten, und dann werden wir gespannt sein, was die Leute entwickeln werden“, sagte Anguelov und wies darauf hin, dass diese Herausforderungen auch dazu beitragen, anzuziehen Aufmerksamkeit und damit Talent für den Bereich der AV- und Robotikforschung.

Der Forscher sagte auch, dass der Waymax-Simulator dazu beitragen könnte, Verbesserungen beim Reinforcement Learning zu erzielen, was dazu führen kann, dass AV-Systeme auftauchendes Verhalten zeigen. Reinforcement Learning ist ein Begriffsbeispiel für maschinelles Lernen, bei dem ein Agent lernt, Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und für jede von ihm ausgeführte Aktion Feedback in Form von Belohnungen oder Strafen erhält – ähnlich wie sich Menschen durch die Welt bewegen. Im Falle von Agenten könnte ein simulierter Fußgänger beispielsweise eine Belohnung dafür erhalten, dass er nicht in einen anderen Fußgänger hineinläuft.

Anguelov sagt, dass dies zu Verhaltensweisen führen kann, die ein Mensch nicht unbedingt an den Tag legen würde, wie z. B. verschiedene Arten von Spurwechseln oder sogar die Bereitschaft vieler Fahrzeuge, konsequent zu fahren, wenn sie sich gegenseitig als AVs erkennen. Das Ergebnis könnte ein sichereres autonomes Fahren sein.

tch-1-tech