1 Punkte von GN⁺ 2024-11-12 | 1 Kommentare | Auf WhatsApp teilen
  • Physische Intelligenz (π)π0: unsere erste allgemeine Policy

  • Wir leben im Zeitalter der AI-Revolution, und AI kann zwar „einfache“ Probleme lösen, etwa Schachpartien gewinnen oder neue Medikamente entdecken, doch Probleme der physischen Welt wie das Falten eines Hemds oder das Aufräumen eines Tisches bleiben weiterhin schwierig. Um das zu lösen, müssen AI-Systeme über physische Intelligenz verfügen.

  • In den vergangenen 8 Monaten haben wir π0 entwickelt, ein allgemeines Robotik-Foundation-Model, als ersten Schritt hin zu einer künstlichen Intelligenz, bei der Nutzer den Roboter um gewünschte Aufgaben bitten können. π0 umfasst Bilder, Text und Aktionen und erwirbt physische Intelligenz durch die Erfahrungen des Roboters.

  • Das Versprechen einer allgemeinen Roboter-Policy

  • Aktuelle Roboter verfügen nur über eng begrenzte Spezialisierungen und können in komplexen Umgebungen nicht handeln. AI kann es Robotern ermöglichen, Anweisungen von Nutzern zu lernen und zu befolgen, und so das Programmieren neuer Verhaltensweisen vereinfachen. Dafür werden viele Daten benötigt.

  • Wenn sich eine allgemeine Roboter-Policy trainieren lässt, kann ein Modell entstehen, das unterschiedliche Fähigkeiten ausführt und verschiedene Roboter steuert. Mit einer kleinen Datenmenge könnte es dann für neue Aufgaben spezialisiert werden.

  • Trainingsmischung über verschiedene Implementierungen hinweg

  • π0 wurde mit Vision-Language-Pretraining im Internet-Maßstab, Open-Source-Datensätzen für Robotermanipulation und fein abgestimmten Arbeitsdatensätzen von 8 unterschiedlichen Robotern trainiert. Es kann vielfältige Aufgaben ausführen, per Zero-Shot-Prompting oder durch Fine-Tuning.

  • Übernahme semantischen Verständnisses im Internet-Maßstab

  • π0 übernimmt semantisches Wissen und visuelles Verständnis von einem im Internet-Maßstab vortrainierten Vision-Language-Model (VLM). VLMs werden darauf trainiert, Texte und Bilder aus dem Web zu modellieren.

  • Post-Training für präzise Manipulation

  • Komplexe und präzise Aufgaben lassen sich durch Fine-Tuning des Modells spezialisieren. Das Falten von Wäsche ist zum Beispiel eine sehr schwierige Aufgabe.

  • Bewertung und Vergleich von π0

  • Im Vergleich mit anderen Robotik-Foundation-Models zeigt π0 bei allen Aufgaben überlegene Leistung. Auch gegenüber π0-small schneidet es besser ab.

  • Ausblick

  • Das Ziel von Physical Intelligence ist die Entwicklung eines Foundation-Models, das alle Roboter steuern kann. Die bisherigen Experimente zeigen, dass es verschiedene Roboter steuern und Aufgaben ausführen kann, die zuvor nicht erfolgreich bewältigt wurden. Allgemeine Roboter-Policies stehen jedoch noch ganz am Anfang, und es sind künftig noch viele Fortschritte nötig.

1 Kommentare

 
GN⁺ 2024-11-12
Hacker-News-Kommentare
  • Es wird darauf hingewiesen, dass Haushaltsroboter für die menschliche Zufriedenheit nötig sind

    • Das Ziel des wirtschaftlichen Werts ist menschliches Glück und Zufriedenheit
    • Mit wachsendem Wohlstand neigt man dazu, Hausarbeit auszulagern
    • Unternehmen haben von der stärkeren Beteiligung von Frauen am Arbeitsmarkt profitiert
    • Es wird vorgeschlagen, dass Haushaltsroboter allen Menschen zur Verfügung gestellt werden könnten
    • Technologische Innovationen werden in den Haushalt eingeführt und machen das Leben bequemer
    • Es wird erwartet, dass Roboter-Maid gesellschaftliche Veränderungen mit sich bringen werden
  • Skeptische Sicht auf die Praxistauglichkeit von Robotern

    • Es wird argumentiert, dass Roboter ohne menschliche Aufsicht nicht praktisch sind
    • Es besteht Skepsis gegenüber der Möglichkeit allgemeiner Haushaltsroboter
  • Das Problem räumlicher Einschränkungen in europäischen Städten

    • Wegen der Platzbeschränkungen in Waschküchen ist der Einsatz von Robotern schwierig
    • Waschküchen befinden sich in kleinen Räumen
    • Für Roboter ist der Zugang zur Waschküche schwierig
  • Das Potenzial von Robotern als Werkzeuge zur Laborautomatisierung

    • Mit verbesserter Präzision wären sie als Werkzeuge zur Laborautomatisierung nützlich
    • Viele Laborarbeiten folgen festgelegten Verfahren
  • Das Potenzial von Kochrobotern

    • Kochroboter wären nützlicher als Wäscheroboter
    • Kochroboter würden die Lebensmittelindustrie stark beeinflussen
  • Das Problem der Einfachheit und der Kosten von Robotern

    • Einfachere Roboter würden geringere Kosten haben
    • Kochen ist häufiger nötig als Wäschewaschen
  • Veränderungen beim Wäschewaschen

    • Jüngere Generationen waschen und bügeln weniger
    • Die Notwendigkeit des Wäschewaschens nimmt ab
  • Das Geschwindigkeitsproblem von Robotern

    • Es gibt Neugier, warum sich Roboter langsam bewegen
    • Es wird gefragt, ob das an der Sicherheit liegt oder daran, dass höhere Geschwindigkeit die Schwierigkeit erhöht