Es ist eine aufregende Zeit für robotisches Lernen. Unternehmen haben Jahrzehnte damit verbracht, komplexe Datensätze zu erstellen und unterschiedliche Methoden zu entwickeln, um Systemen beizubringen, neue Aufgaben auszuführen. Es scheint, dass wir an der Schwelle zu echten Durchbrüchen stehen, wenn es um den Einsatz von Technologien geht, die sich im Handumdrehen anpassen und lernen können.
Im vergangenen Jahr haben wir eine Vielzahl faszinierender Studien gesehen. Nehmen Sie VRB (Vision-Robotics Bridge), das die Carnegie Mellon University bereits im Juni vorstellte. Das System ist in der Lage, Erkenntnisse aus YouTube-Videos auf verschiedene Umgebungen anzuwenden, sodass ein Programmierer nicht alle möglichen Variationen berücksichtigen muss.
Letzten Monat präsentierte das DeepMind-Robotikteam von Google seine eigene beeindruckende Arbeit in Form von RT-2 (Robotic Transformer 2). Das System ist in der Lage, Details der Ausführung einer Aufgabe zu abstrahieren. Um einem Roboter in dem gegebenen Beispiel zu sagen, er solle ein Stück Müll wegwerfen, muss ein Programmierer dem Roboter nicht beibringen, bestimmte Müllstücke zu identifizieren, sie aufzuheben und wegzuwerfen, um eine scheinbar einfache (für Menschen mindestens) Aufgabe.
Weitere von der CMU in dieser Woche hervorgehobene Forschungsergebnisse vergleichen ihre Arbeit mit menschlichem Lernen im Frühstadium. Konkret wird der Roboter-KI-Agent mit einem dreijährigen Kleinkind verglichen. Im Kontext wird das Lernniveau in zwei Kategorien unterteilt: aktives und passives Lernen.
Passives Lernen bedeutet in diesem Fall, einem System beizubringen, eine Aufgabe auszuführen, indem man ihm Videos zeigt oder es anhand der oben genannten Datensätze trainiert. Aktives Lernen ist genau das, wonach es sich anhört – rausgehen, eine Aufgabe erledigen und sich anpassen, bis man sie richtig hinbekommt.
RoboAgent, eine gemeinsame Anstrengung von CMU und Meta AI (ja, diese Meta), kombiniert diese beiden Arten des Lernens, ähnlich wie es ein Mensch tun würde. Dabei geht es um die Beobachtung von Aufgaben über das Internet, gepaart mit aktivem Lernen durch Fernsteuerung des Roboters. Nach Angaben des Teams ist das System in der Lage, Erkenntnisse aus einer Umgebung zu übernehmen und auf eine andere anzuwenden, ähnlich wie das oben erwähnte VRB-System.
„Ein Agent, der zu dieser Art des Lernens fähig ist, bringt uns einem allgemeinen Roboter näher, der eine Vielzahl von Aufgaben in verschiedenen, unsichtbaren Umgebungen erledigen kann und sich kontinuierlich weiterentwickelt, während er mehr Erfahrungen sammelt“, sagt Shubham Tulsiani vom Robotics Institute der CMU. „RoboAgent kann einen Roboter mithilfe begrenzter domäneninterner Daten schnell trainieren und sich dabei hauptsächlich auf reichlich verfügbare kostenlose Daten aus dem Internet stützen, um eine Vielzahl von Aufgaben zu erlernen. Dies könnte Roboter in unstrukturierten Umgebungen wie Häusern, Krankenhäusern und anderen öffentlichen Räumen nützlicher machen.“
Einer der cooleren Aspekte von all dem ist die Tatsache, dass der Datensatz Open Source und allgemein zugänglich ist. Es ist auch für den Einsatz mit leicht verfügbarer, handelsüblicher Robotik-Hardware konzipiert, was bedeutet, dass Forscher und Unternehmen gleichermaßen einen wachsenden Fundus an Roboterdaten und -fähigkeiten nutzen und ausbauen können.
„RoboAgents verfügen über weitaus komplexere Fähigkeiten als andere“, sagt Abhinav Gupta vom Robotics Institute. „Wir haben eine größere Vielfalt an Fähigkeiten gezeigt als alles, was jemals ein einzelner Roboteragent in der realen Welt erreicht hat, mit Effizienz und einem Ausmaß an Verallgemeinerung auf unsichtbare Szenarien, das einzigartig ist.“
Das sind alles sehr vielversprechende Dinge, wenn es um den Bau und Einsatz von Mehrzweck-Robotiksystemen mit Blick auf künftige Allzweckroboter geht. Das Ziel besteht darin, eine Technologie zu schaffen, die über die sich wiederholenden Maschinen in stark strukturierten Umgebungen hinausgeht, an die wir normalerweise denken, wenn wir an Industrieroboter denken. Die tatsächliche Nutzung und Skalierung in der Praxis ist natürlich viel leichter gesagt als getan.
Bei diesen Ansätzen des robotergestützten Lernens sind wir noch viel näher am Anfang, aber wir befinden uns in einer aufregenden Zeit für aufkommende Mehrzwecksysteme.