Das MIT stellt eine von großen Sprachmodellen inspirierte Methode vor, um Robotern neue Fähigkeiten beizubringen

MIT diese Woche stellte ein neues Modell vor zum Trainieren von Robotern. Anstelle des Standardsatzes fokussierter Daten, der zum Erlernen neuer Aufgaben für Roboter verwendet wird, geht die Methode weit und ahmt die riesigen Informationsbestände nach, die zum Trainieren großer Sprachmodelle (LLMs) verwendet werden.

Die Forscher stellen fest, dass Nachahmungslernen – bei dem der Agent lernt, indem er einer Person bei der Ausführung einer Aufgabe folgt – scheitern kann, wenn kleine Herausforderungen eingeführt werden. Das können Dinge wie Beleuchtung, eine andere Umgebung oder neue Hindernisse sein. In solchen Szenarien verfügen die Roboter einfach nicht über genügend Daten, auf die sie zurückgreifen können, um sich anzupassen.

Das Team nutzte Modelle wie GPT-4 als eine Art Brute-Force-Datenansatz zur Problemlösung.

„Im Sprachbereich sind die Daten allesamt nur Sätze“, sagt Lirui Wang, der Hauptautor der neuen Arbeit. „In der Robotik brauchen wir angesichts der Heterogenität der Daten eine andere Architektur, wenn man auf ähnliche Weise vorab trainieren möchte.“

Das Team führte eine neue Architektur namens Heterogeneous Pretrained Transformers (HPT) ein, die Informationen von verschiedenen Sensoren und verschiedenen Umgebungen zusammenführt. Anschließend wurde ein Transformator verwendet, um die Daten zu Trainingsmodellen zusammenzuführen. Je größer der Transformator, desto besser die Leistung.

Anschließend geben die Benutzer das Roboterdesign, die Konfiguration und die gewünschte Aufgabe ein.

„Unser Traum ist es, ein universelles Robotergehirn zu haben, das Sie ohne jegliche Schulung herunterladen und für Ihren Roboter verwenden können“, sagte David Held, außerordentlicher Professor an der CMU, über die Forschung. „Obwohl wir uns noch in der Anfangsphase befinden, werden wir weiterhin hart arbeiten und hoffen, dass die Skalierung zu einem Durchbruch in der Roboterpolitik führt, wie es bei großen Sprachmodellen der Fall war.“

Die Forschung wurde teilweise vom Toyota Research Institute ins Leben gerufen. Letztes Jahr stellte TRI auf der Tech Disrupt eine Methode zum Training von Robotern über Nacht vor. Kürzlich ist das Unternehmen eine bahnbrechende Partnerschaft eingegangen, die seine Roboterlernforschung mit der Hardware von Boston Dynamics vereinen wird.

tch-1-tech