Google DeepMind vereint Forscher, um ein ImageNet von Roboteraktionen zu erstellen

Von allen heiligen Gralen der Robotik ist das Lernen möglicherweise der heiligste. In einer Zeit, in der der Begriff „Allgemeinzweck“ mit großer Hingabe verwendet wird, kann es für Nichtrobotiker jedoch schwierig sein zu verstehen, was heutige Systeme leisten können – und was nicht. Die Wahrheit ist, dass die meisten Roboter heutzutage dafür gebaut sind, eine Sache (oder mehrere, wenn Sie Glück haben) wirklich gut zu erledigen.

Es ist eine Wahrheit, die sich über die gesamte Branche erstreckt, vom einfachsten Roboterstaubsauger bis zum fortschrittlichsten Industriesystem. Wie schaffen wir also den Übergang von der Einzel- zur Allzweckrobotik? Sicherlich wird es auf dem Weg viele Stopps in Mehrzweckgebieten geben.

Die Antwort ist natürlich Roboterlernen. Wenn Sie heutzutage in fast jedes Robotik-Forschungslabor gehen, werden Sie auf Teams stoßen, die an der Lösung des Problems arbeiten. Das Gleiche gilt auch für Startups und Konzerne. Schauen Sie sich die Unternehmen Viam und Intrinsic an, die daran arbeiten, die Einstiegshürde für die Roboterprogrammierung zu senken.

Die Lösungsmöglichkeiten sind derzeit recht breit gefächert, aber mir wird immer klarer, dass dies ein Problem ist, das nicht mit einer einzigen Wunderwaffe gelöst werden kann. Vielmehr wird der Aufbau komplexerer und leistungsfähigerer Systeme mit ziemlicher Sicherheit eine Kombination von Lösungen erfordern. Im Mittelpunkt der meisten davon steht jedoch die Notwendigkeit eines großen, gemeinsam genutzten Datensatzes.

Das DeepMind-Robotikteam von Google gab diese Woche die Arbeit bekannt, die es mit 33 Forschungsinstituten durchgeführt hat, um eine riesige, gemeinsame Datenbank namens „ Öffnen Sie die X-Verkörperung. Die Forscher hinter dem Projekt vergleichen es mit ImageNet, einer Datenbank mit mehr als 14 Millionen Bildern geht zurück auf 2009.

„So wie ImageNet die Computer-Vision-Forschung vorangetrieben hat, glauben wir, dass Open „Der Aufbau eines Datensatzes verschiedener Roboterdemonstrationen ist der entscheidende Schritt zum Trainieren eines generalistischen Modells, das viele verschiedene Arten von Robotern steuern, vielfältigen Anweisungen folgen, grundlegende Überlegungen zu komplexen Aufgaben anstellen und effektiv verallgemeinern kann.“

Sie fügen hinzu, dass eine solche Aufgabe viel zu groß sei, um sie einem einzelnen Labor anzuvertrauen. Die Datenbank umfasst mehr als 500 Fähigkeiten und 150.000 Aufgaben von 22 verschiedenen Robotertypen. Wie der Teil „Offen“ im Namen andeutet, stellen die Entwickler die Daten der Forschungsgemeinschaft zur Verfügung.

„Wir hoffen, dass die offene Bereitstellung der Daten und die Bereitstellung sicherer, aber begrenzter Modelle Hindernisse abbauen und die Forschung beschleunigen werden“, fügt das Team hinzu. „Die Zukunft der Robotik hängt davon ab, dass Roboter voneinander lernen können und, was am wichtigsten ist, dass Forscher voneinander lernen können.“

tch-1-tech