Physical Intelligence stellt π0 vor, die erste allgemeine Policy-KI mit Potenzial für Wäschefalten
(physicalintelligence.company)-
Physische Intelligenz (π)π0: unsere erste allgemeine Policy
-
Wir leben im Zeitalter der AI-Revolution, und AI kann zwar „einfache“ Probleme lösen, etwa Schachpartien gewinnen oder neue Medikamente entdecken, doch Probleme der physischen Welt wie das Falten eines Hemds oder das Aufräumen eines Tisches bleiben weiterhin schwierig. Um das zu lösen, müssen AI-Systeme über physische Intelligenz verfügen.
-
In den vergangenen 8 Monaten haben wir π0 entwickelt, ein allgemeines Robotik-Foundation-Model, als ersten Schritt hin zu einer künstlichen Intelligenz, bei der Nutzer den Roboter um gewünschte Aufgaben bitten können. π0 umfasst Bilder, Text und Aktionen und erwirbt physische Intelligenz durch die Erfahrungen des Roboters.
-
Das Versprechen einer allgemeinen Roboter-Policy
-
Aktuelle Roboter verfügen nur über eng begrenzte Spezialisierungen und können in komplexen Umgebungen nicht handeln. AI kann es Robotern ermöglichen, Anweisungen von Nutzern zu lernen und zu befolgen, und so das Programmieren neuer Verhaltensweisen vereinfachen. Dafür werden viele Daten benötigt.
-
Wenn sich eine allgemeine Roboter-Policy trainieren lässt, kann ein Modell entstehen, das unterschiedliche Fähigkeiten ausführt und verschiedene Roboter steuert. Mit einer kleinen Datenmenge könnte es dann für neue Aufgaben spezialisiert werden.
-
Trainingsmischung über verschiedene Implementierungen hinweg
-
π0 wurde mit Vision-Language-Pretraining im Internet-Maßstab, Open-Source-Datensätzen für Robotermanipulation und fein abgestimmten Arbeitsdatensätzen von 8 unterschiedlichen Robotern trainiert. Es kann vielfältige Aufgaben ausführen, per Zero-Shot-Prompting oder durch Fine-Tuning.
-
Übernahme semantischen Verständnisses im Internet-Maßstab
-
π0 übernimmt semantisches Wissen und visuelles Verständnis von einem im Internet-Maßstab vortrainierten Vision-Language-Model (VLM). VLMs werden darauf trainiert, Texte und Bilder aus dem Web zu modellieren.
-
Post-Training für präzise Manipulation
-
Komplexe und präzise Aufgaben lassen sich durch Fine-Tuning des Modells spezialisieren. Das Falten von Wäsche ist zum Beispiel eine sehr schwierige Aufgabe.
-
Bewertung und Vergleich von π0
-
Im Vergleich mit anderen Robotik-Foundation-Models zeigt π0 bei allen Aufgaben überlegene Leistung. Auch gegenüber π0-small schneidet es besser ab.
-
Ausblick
-
Das Ziel von Physical Intelligence ist die Entwicklung eines Foundation-Models, das alle Roboter steuern kann. Die bisherigen Experimente zeigen, dass es verschiedene Roboter steuern und Aufgaben ausführen kann, die zuvor nicht erfolgreich bewältigt wurden. Allgemeine Roboter-Policies stehen jedoch noch ganz am Anfang, und es sind künftig noch viele Fortschritte nötig.
1 Kommentare
Hacker-News-Kommentare
Es wird darauf hingewiesen, dass Haushaltsroboter für die menschliche Zufriedenheit nötig sind
Skeptische Sicht auf die Praxistauglichkeit von Robotern
Das Problem räumlicher Einschränkungen in europäischen Städten
Das Potenzial von Robotern als Werkzeuge zur Laborautomatisierung
Das Potenzial von Kochrobotern
Das Problem der Einfachheit und der Kosten von Robotern
Veränderungen beim Wäschewaschen
Das Geschwindigkeitsproblem von Robotern