Figur Gründer und CEO Brett Adcock Donnerstag enthüllt Ein neues maschinelles Lernmodell für humanoide Roboter. Die Nachrichten, die zwei Wochen nach der Bekanntgabe der Entscheidung des Bay Area Robotics-Unternehmens, sich von einer OpenAI-Zusammenarbeit zu entfernen, ankommt, dreht sich um Helix, ein „Generalist“ -Modell für Vision-Language-Action (VLA).
VLAs sind ein neues Phänomen für die Robotik, die Visionen und Sprachbefehle nutzt, um Informationen zu verarbeiten. Derzeit ist das bekannteste Beispiel für die Kategorie RT-2 von Google DeepMind, das Roboter durch eine Kombination aus Video- und Großsprachenmodellen (LLMs) trainiert.
Helix arbeitet ähnlich und kombiniert visuelle Daten und Sprachaufforderungen, einen Roboter in Echtzeit zu steuern. Abbildung schreibt: „Helix zeigt eine starke Verallgemeinerung von Objekten und kann Tausende neuartiger Haushaltsgegenstände mit unterschiedlichen Formen, Größen, Farben und Materialeigenschaften aufnehmen, die noch nie zuvor im Training auftreten, indem sie einfach in der natürlichen Sprache fragen.“
In einer idealen Welt könnte man einem Roboter einfach sagen, er solle etwas tun, und es würde es einfach tun. Hier kommt Helix nach Abbildung ins Spiel. Die Plattform wurde entwickelt, um die Lücke zwischen Vision und Sprachverarbeitung zu schließen. Nachdem der Roboter eine natürliche Sprachsprache erhalten hat, bewertet er seine Umgebung visuell und führt dann die Aufgabe aus.
Figur bietet Beispiele wie „Geben Sie die Tasche mit Keksen dem Roboter auf der rechten Seite“ oder „Empfangen Sie die Tasche mit Keksen vom Roboter links und legen Sie sie in die offene Schublade“. Beide Beispiele beinhalten ein Paar Roboter, die zusammenarbeiten. Dies liegt daran, dass Helix so konzipiert ist, dass zwei Roboter gleichzeitig kontrolliert werden, wobei einer die andere bei der Ausführung verschiedener Haushaltsaufgaben unterstützt.
Die Figur zeigt die VLM, indem die Arbeit, die das Unternehmen mit seinem 02 Humanoid -Roboter in der heimischen Umgebung geleistet hat, hervorhebt. Häuser sind für Roboter notorisch schwierig, da ihnen die Struktur und Konsistenz von Lagern und Fabriken fehlt.
Schwierigkeiten mit Lernen und Kontrolle sind wichtige Hürden zwischen komplexen Robotersystemen und dem Haus. Diese Themen sind zusammen mit fünf bis sechsstelligen Preisschildern der Grund, warum der Heimroboter für die meisten humanoiden Robotikunternehmen keine Vorrang hatte. Im Allgemeinen besteht der Ansatz darin, Roboter für Industriekunden zu bauen, sowohl die Zuverlässigkeit zu verbessern als auch die Kosten zu senken, bevor die Wohnungen angegangen werden. Hausarbeit ist in einigen Jahren ein Gespräch.
Als Tech im Jahr 2024 die Büros der Bay Area in der Figur besichtigte, zeigte ADCOCK einige außerhalb der Schritte, die das Unternehmen im Heimatum seine Humanoid durchsetzte. Es schien zu dem Zeitpunkt, als die Arbeit nicht priorisiert wurde, da sich die Figur auf Arbeitsplatzpiloten mit Unternehmen wie BMW konzentriert.

Mit der Helix -Ankündigung am Donnerstag macht Figur deutlich, dass das Haus für sich genommen eine Priorität haben sollte. Es ist eine herausfordernde und komplexe Umgebung für das Testen dieser Art von Trainingsmodellen. Das Unterrichten von Robotern, um komplexe Aufgaben in der Küche zu erledigen – zum Beispiel -, öffnet sie zu einer breiten Palette von Aktionen in verschiedenen Umgebungen.
„Damit Roboter in den Haushalten nützlich sind, müssen sie in der Lage sein, intelligente neue Verhaltensweisen aufzuarbeiten, insbesondere für Objekte, die sie noch nie gesehen haben“, sagt Figur. „Das Unterrichten von Robotern muss derzeit auch ein einziges neues Verhalten erheblich menschlich anstrengen: entweder Stunden der Expertenhandbuchprogrammierung auf Doktoranden oder Tausende von Demonstrationen.“
Manuelle Programmierung wird für das Haus nicht skaliert. Es gibt einfach zu viele Unbekannte. Küchen, Wohnzimmer und Badezimmer variieren dramatisch von einem zum anderen. Gleiches gilt für die Werkzeuge, die zum Kochen und Reinigen verwendet werden. Außerdem verlassen die Menschen Unordnung, ordnen Möbel neu und bevorzugen eine Reihe verschiedener Umweltbeleuchtung. Diese Methode braucht viel zu viel Zeit und Geld – obwohl die Figur sicherlich viel von letzterem hat.
Die andere Option ist das Training – und viel davon. Roboterarme, die für die Auswahl und Plätze von Objekten in Labors ausgebildet sind, verwenden diese Methode häufig. Was Sie nicht sehen, sind, dass die Hunderte von Stunden der Wiederholung erforderlich sind, um eine Demo robust genug zu machen, um hoch variable Aufgaben zu übernehmen. Um beim ersten Mal etwas richtig aufzuheben, muss ein Roboter in der Vergangenheit Hunderte Male getan haben.
Wie im Moment so viel umgebende humanoide Robotik ist die Arbeit an Helix noch in einem sehr frühen Stadium. Die Zuschauern sollten darauf hingewiesen werden, dass hinter den Kulissen viel Arbeit geschieht, um die Art von kurzen, gut produzierten Videos in diesem Beitrag zu erstellen. Die heutige Ankündigung ist im Wesentlichen ein Rekrutierungs -Tool, das mehr Ingenieure an Bord bringen soll, um das Projekt auszubauen.