Die meisten Berichte über humanoide Roboter haben sich verständlicherweise auf das Hardware-Design konzentriert. Angesichts der Häufigkeit, mit der ihre Entwickler mit dem Ausdruck „Humanoide für allgemeine Zwecke“ um sich werfen, sollte dem ersten Teil mehr Aufmerksamkeit gewidmet werden. Nach Jahrzehnten der Einzwecksysteme wird der Sprung zu allgemeineren Systemen ein großer sein. So weit sind wir einfach noch nicht.
Das Streben nach einer Roboterintelligenz, die die große Bandbreite an Bewegungen, die das zweibeinige humanoide Design ermöglicht, voll ausnutzen kann, ist ein zentrales Thema für Forscher. Auch der Einsatz generativer KI in der Robotik ist in letzter Zeit ein brandaktuelles Thema. Neue Forschung vom MIT weist darauf hin, dass Letzteres Ersteres tiefgreifend beeinflussen könnte.
Eine der größten Herausforderungen auf dem Weg zu universellen Systemen ist die Schulung. Wir verfügen über ein solides Verständnis der besten Methoden, um Menschen für verschiedene Aufgaben zu schulen. Die Ansätze zur Robotik sind zwar vielversprechend, aber fragmentarisch. Es gibt viele vielversprechende Methoden, darunter Verstärkungs- und Imitationslernen, aber zukünftige Lösungen werden wahrscheinlich Kombinationen dieser Methoden beinhalten, ergänzt durch generative KI-Modelle.
Einer der wichtigsten Anwendungsfälle, die das MIT-Team vorgeschlagen hat, ist die Möglichkeit, relevante Informationen aus diesen kleinen, aufgabenspezifischen Datensätzen zusammenzutragen. Die Methode wird Policy Composition (PoCo) genannt. Zu den Aufgaben gehören nützliche Roboteraktionen wie das Einschlagen eines Nagels oder das Umdrehen von Dingen mit einem Spachtel.
„[Researchers] „Sie trainieren ein separates Diffusionsmodell, um eine Strategie oder Richtlinie zum Erledigen einer Aufgabe anhand eines bestimmten Datensatzes zu erlernen“, stellt die Schule fest. „Anschließend kombinieren sie die von den Diffusionsmodellen erlernten Richtlinien zu einer allgemeinen Richtlinie, die es einem Roboter ermöglicht, mehrere Aufgaben in verschiedenen Umgebungen auszuführen.“
Laut MIT verbesserte die Einbindung von Diffusionsmodellen die Aufgabenleistung um 20 %. Dazu gehört die Fähigkeit, Aufgaben auszuführen, die mehrere Tools erfordern, sowie das Lernen/Anpassen an unbekannte Aufgaben. Das System ist in der Lage, relevante Informationen aus verschiedenen Datensätzen in einer Aktionskette zu kombinieren, die zur Ausführung einer Aufgabe erforderlich ist.
„Einer der Vorteile dieses Ansatzes ist, dass wir Strategien kombinieren können, um das Beste aus beiden Welten zu erhalten“, sagt der Hauptautor des Artikels, Lirui Wang. „Beispielsweise könnte eine Strategie, die auf realen Daten trainiert wurde, mehr Geschicklichkeit erreichen, während eine Strategie, die auf Simulationen trainiert wurde, möglicherweise mehr Generalisierung erreichen könnte.“
Das Ziel dieser spezifischen Arbeit ist die Entwicklung intelligenter Systeme, die es Robotern ermöglichen, verschiedene Werkzeuge auszutauschen, um unterschiedliche Aufgaben auszuführen. Die Verbreitung von Mehrzwecksystemen würde die Branche dem Traum der Allzwecknutzung einen Schritt näher bringen.