2 Punkte von GN⁺ 2023-09-21 | 1 Kommentare | Auf WhatsApp teilen
  • Das Toyota Research Institute (TRI) hat einen Durchbruch beim Beibringen neuer Fähigkeiten an Roboter bekannt gegeben. Dafür nutzt es einen generativen AI-Ansatz auf Basis von Diffusion Policy.
  • Dieser neue Ansatz verbessert den praktischen Nutzen von Robotern deutlich und ist ein weiterer Schritt hin zum Aufbau von „Large Behavior Models (LBMs)“ für Roboter, ähnlich den Large Language Models (LLMs), die konversationelle AI revolutioniert haben.
  • Die neue Trainingsmethode ist effizient und erzeugt leistungsstarke Verhaltensweisen, sodass Roboter Menschen wirksamer unterstützen können.
  • Frühere Trainingsmethoden für Roboter waren langsam, inkonsistent und ineffizient und meist auf eng umrissene Aufgaben in sehr begrenzten Umgebungen beschränkt.
  • Mit dem neuen Ansatz hat TRI Robotern mehr als 60 schwierige, feinmotorische Fähigkeiten beigebracht, etwa Flüssigkeiten eingießen, Werkzeuge benutzen und verformbare Objekte manipulieren.
  • TRI verfolgt das Ziel, bis Ende dieses Jahres Hunderte neuer Fähigkeiten und bis Ende 2024 insgesamt 1.000 Fähigkeiten zu vermitteln.
  • Die Roboter von TRI können nun auf vielfältige und reichhaltige Weise mit der Welt interagieren. Das könnte Robotern eines Tages ermöglichen, Menschen in Alltagssituationen sowie in unvorhersehbaren und sich ständig verändernden Umgebungen zu unterstützen.
  • Das Verhaltensmodell für Roboter von TRI kombiniert taktile Demonstrationen eines Lehrenden mit sprachlichen Beschreibungen des Ziels und nutzt eine AI-basierte Diffusion Policy, um die demonstrierten Fähigkeiten zu erlernen.
  • TRI hat Diffusion Policy in Zusammenarbeit mit der Forschungsgruppe von Professor Song an der Columbia University entwickelt. Dabei handelt es sich um einen leistungsstarken generativen AI-Ansatz für das Lernen von Verhaltensweisen.
  • Die Roboterplattform von TRI wurde speziell für geschickte bimanuale Manipulationsaufgaben entwickelt und ermöglicht taktiles Feedback sowie Tastsensorik.
  • TRI nutzt Drake, ein modellbasiertes Designsystem für die Robotik, das ein modernes Toolset und eine Simulationsplattform bereitstellt, um die Entwicklung in Simulation und Realität weiter auszuweiten und zu beschleunigen.
  • Sicherheit ist ein Kernbestandteil der Robotikentwicklung bei TRI. Das System enthält robuste Schutzmechanismen, die darauf ausgelegt sind, Sicherheitsgarantien einzuhalten, etwa dass der Roboter nicht mit sich selbst oder seiner Umgebung kollidiert.
  • Weitere technische Informationen zu diesem Durchbruch von TRI finden sich im Medium-Blog von TRI; außerdem soll das Thema am 4. Oktober in einer LinkedIn Live Q&A-Session besprochen werden.

1 Kommentare

 
GN⁺ 2023-09-21
Hacker-News-Kommentare
  • Das Toyota Research Institute (TRI) wird dafür gelobt, einen Fortschritt dabei erzielt zu haben, Robotern neue Verhaltensweisen beizubringen.
  • Der Schlüssel zu diesem Fortschritt liegt in der Diffusion Policy, die im Labor von Professorin Shuran Song an der Columbia University entwickelt wurde und sich inzwischen an der Stanford University befindet.
  • Diffusion Policy gewann in der Community so viel Aufmerksamkeit, dass die Arbeit auf der diesjährigen R:SS-Konferenz den Best Paper Award erhielt.
  • Professorin Song gilt als eine führende Persönlichkeit der Robotik, mit mehreren Ansätzen, die sich auf Anwendungen in der realen Welt skalieren lassen.
  • Russ Tedrakes Online-Kurs Underactuated Robotics wird empfohlen, um die Komplexität der Robotik besser zu verstehen.
  • Auch Google verfolgt ein ähnliches Projekt mit Schwerpunkt auf Kraft-Feedback und Drucksensoren.
  • Das Video von Toyota Research mit einem Pfannkuchen wendenden Roboter, das zeigt, wie Roboter durch Demonstration lernen, wird als beeindruckend bewertet.
  • Einige Nutzer vergleichen die Arbeit von TRI mit Googles PaLM-E-Projekt und sehen darin eine spannende Zeit für die Robotik.
  • Allzweck-Humanoiden könnten durch die Kombination von Motion-Capture-Technologie und Machine-Learning-Algorithmen erreicht werden.
  • Einige Nutzer stellen die Praxistauglichkeit infrage, zwei Vollzeitpositionen gleichzeitig zu übernehmen, etwa wenn ein MIT-Professor zugleich Vizepräsident bei TRI ist.
  • Es gibt Bedenken hinsichtlich möglicher Risiken beim Einsatz von Gen-AI in der Robotik, da unerwartete Bewegungen Schäden oder Verletzungen verursachen könnten.