1 Punkte von GN⁺ 2025-10-10 | 1 Kommentare | Auf WhatsApp teilen
  • Figure AI hat mit Figure 03 einen humanoiden Roboter der 3. Generation vorgestellt, der allgemeine Aufgaben ausführen und direkt von Menschen lernen kann; Ziel sind der Einsatz im Haushalt, im kommerziellen Bereich und die Massenproduktion
  • Ausgestattet mit einem Sensorsystem und einem Handsystem der nächsten Generation, die für das eigenentwickelte Vision-Language-Action-AI Helix entwickelt wurden, erreicht er die doppelte Bildrate, ein Viertel der Latenz und ein um 60 % größeres Sichtfeld und ermöglicht so präzise Manipulation und intelligente Navigation in komplexen Umgebungen
  • Zu den Merkmalen für mehr Sicherheit im Haushalt gehören Schaumstoff mit mehrlagiger Dichte und weiche Stoffabdeckungen, waschbare austauschbare Kleidung, kabelloses Laden, ein nach UN38.3 zertifizierter Akku sowie ein verbessertes Audiosystem für Echtzeit-Sprachdialoge
  • Für die Massenproduktion wurde von CNC-Bearbeitung auf formgebende Verfahren wie Druckguss, Spritzguss und Stanzen umgestellt, wodurch die Zahl der Teile und die Herstellungskosten deutlich sinken; in der eigenen Fertigungsanlage BotQ sind bis zu 12.000 Einheiten pro Jahr möglich
  • Mit hochauflösenden taktilen Sensoren, die Druck bis zu 3 Gramm an den Fingerspitzen erkennen, und in die Handflächen eingebetteten Kameras kann Helix Objekte unterschiedlichster Form und Materialien stabil greifen; 10-Gbps-mmWave-Daten-Offload ermöglicht kontinuierliches Lernen und schafft damit die Grundlage für einen echten Universalroboter

Figure 03

  • Figure 03 ist Figures humanoider Roboter der 3. Generation, eine Plattform für Helix, den Haushalt und die globale Skalierung
  • Ziel ist ein echter Universalroboter, der menschenähnliche Aufgaben ausführt und direkt von Menschen lernt
  • Dafür wurden Hardware und Software vollständig neu entwickelt; die wichtigsten Merkmale sind unten aufgeführt
  • Helix: Figure 03 nutzt ein speziell entwickeltes Sensorsystem und eine Handstruktur zur Unterstützung von Helix, einer proprietären Vision-Language-Action-AI
  • Haushalt: Durch Funktionen wie feinere Materialien, kabelloses Laden, ein verbessertes Audiosystem und höhere Batteriesicherheit wurden Sicherheit und Nutzbarkeit deutlich verbessert
  • Massenproduktion: Das System wurde mit Blick auf eine hochwertige Großserienfertigung entwickelt, wofür neue Lieferketten und Fertigungsprozesse aufgebaut wurden
  • Globale Expansion: Niedrige Herstellungskosten und Fortschritte bei den Helix-bezogenen Technologien erhöhen auch die kommerzielle Einsetzbarkeit erheblich

Für Helix entwickelt

  • Ausgehend von der Einschätzung, dass humanoide Roboter ohne AI nicht skalierbar sind, wurde Figure 03 mit dem Kernziel entwickelt, reales Schlussfolgern durch Helix AI zu ermöglichen
    • Das vollständig neu entwickelte Sensor- und Handsystem wurde speziell für den Betrieb mit Helix gebaut
  • Das Vision-System der nächsten Generation unterstützt hochfrequente visuo-motorische Steuerung
    • Die neue Kameraarchitektur erreicht die doppelte Bildrate, ein Viertel der Latenz und ein um 60 % größeres Sichtfeld pro Kamera in einem kompakteren Formfaktor
    • In Kombination mit der erweiterten Tiefenschärfe liefert sie Helix einen dichteren und stabileren Perception-Stream
    • Diese Fortschritte sind essenziell für intelligente Navigation und präzise Manipulation in komplexen und beengten Räumen wie dem Haushalt
  • In jede Hand ist eine in die Handfläche eingebettete Kamera mit weitem Sichtfeld und geringer Latenz integriert
    • Sie liefert redundantes visuelles Feedback aus kurzer Distanz während des Greifens
    • Selbst wenn die Hauptkamera verdeckt ist, etwa bei Arbeiten in Schränken oder engen Räumen, kann Helix die visuelle Wahrnehmung aufrechterhalten und adaptive Echtzeitsteuerung umsetzen
  • Die Hand von Figure 03 stellt einen großen Sprung bei Nachgiebigkeit und taktilem Design dar
    • Weichere und anpassungsfähigere Fingerspitzen vergrößern die Kontaktfläche und ermöglichen stabileres Greifen bei Objekten unterschiedlichster Form und Größe
    • Eine Untersuchung vorhandener Marktoptionen ergab grundlegende Grenzen heutiger taktiler Sensoren für den realen Einsatz; deshalb wurde intern ein eigener taktiler Sensor der ersten Generation entwickelt
      • Er wurde nach drei Prinzipien ausgelegt: extreme Haltbarkeit, langfristige Zuverlässigkeit und hochpräzise Sensorik
    • Jeder Fingerspitzensensor kann Kräfte von nur 3 Gramm Druck erfassen – empfindlich genug, um das Gewicht einer auf den Finger gelegten Büroklammer zu erkennen
      • Mit dieser Präzision kann Helix zwischen sicherem Greifen und ersten Anzeichen von Rutschen unterscheiden und so empfindliche Kontrolle über fragile, unregelmäßige oder bewegte Objekte ausüben
  • Enthalten ist außerdem 10-Gbps-mmWave-Daten-Offload, sodass die gesamte Flotte Terabytes an Daten für kontinuierliches Lernen und Verbesserung hochladen kann
    • Diese Fortschritte machen Figure 03 in besonderer Weise geeignet für groß angelegtes End-to-End Pixel-to-Action-Lernen

Für den Haushalt entwickelt

  • Damit ein Roboter im Haushalt effektiv arbeiten kann, muss er reibungslos mit Menschen in Alltagsumgebungen zusammenarbeiten
    • Vor diesem Hintergrund führt Figure 03 mehrere Designverbesserungen mit Fokus auf Sicherheit ein
  • Strategisch platzierter Schaumstoff mit mehrlagiger Dichte verhindert Quetschstellen; anstelle harter bearbeiteter Teile ist das System mit weichem Stoff überzogen
    • Im Vergleich zu Figure 02 wurde die Masse um 9 % reduziert und das Volumen deutlich verringert, was die Bewegung in Wohnräumen erleichtert
  • Der Akku von Figure 03 erweitert die Grenzen der Batteriesicherheit bei Robotern
    • Er umfasst mehrschichtigen Schutz gegen Missbrauch oder Fehlfunktionen auf BMS-, Zell-, Verbindungs- und Pack-Ebene
    • Die Zertifizierung nach UN38.3 wurde bereits erreicht
  • Neben der Sicherheit wurde Figure 03 auch auf alltägliche Nutzbarkeit ausgelegt
    • Der weiche Stoff ist vollständig waschbar und kann ohne Werkzeug entfernt oder ausgetauscht werden, was einen schnellen und einfachen Wechsel ermöglicht
    • Er lässt sich mit verschiedenen Bekleidungsoptionen anpassen, einschließlich Kleidung aus schnittfesten und langlebigen Materialien
  • Für eine natürlichere Kommunikation mit dem Roboter verfügt Figure 03 über ein aufgerüstetes Audiosystem für bessere Echtzeit-Sprachdialoge
    • Gegenüber Figure 02 wurde die Lautsprechergröße verdoppelt und die Ausgangsleistung fast vervierfacht
    • Die Mikrofone wurden für bessere Leistung und Klarheit neu positioniert
  • Im Sinne einer vollständig autonomen und kabellosen Systemvision unterstützt Figure 03 kabelloses induktives Laden und kabellosen Daten-Offload
    • Mit den Ladespulen in den Füßen lädt der Roboter mit 2 kW, indem er einfach auf einem kabellosen Stand steht
    • So kann der Roboter in einer Haushaltsumgebung den ganzen Tag über bei Bedarf automatisch andocken und nachladen

Für die Massenproduktion entwickelt

  • Humanoide Roboter wurden traditionell als zeitaufwendige und kostspielige Engineering-Prototypen entwickelt
    • Figure 03 ist der erste Roboter, der von Anfang an mit dem Ziel der Massenproduktion entworfen wurde
  • Erreicht wurde dies durch drei zentrale Initiativen
    • Neugestaltung von Design und Prozessen
    • Aufbau einer vollständig neuen Lieferkette
    • Entwicklung der Hochvolumen-Fertigungsanlage BotQ
  • Beim Übergang von Figure 02 zu Figure 03 wurde nahezu jede Komponente des Roboters mit Blick auf Herstellbarkeit und Kosten neu entwickelt
    • Die Teams aus Maschinenbau und Elektrotechnik reduzierten aggressiv die Zahl der Teile, Montageschritte und Komponenten, die für die Erfüllung der Designanforderungen nicht zwingend notwendig waren
    • Während Figure 02 überwiegend für die Fertigung per CNC-Bearbeitung ausgelegt war, setzt Figure 03 stark auf Druckguss, Spritzguss und Stanzen
      • Dieser Wechsel erforderte zwar erhebliche Vorabinvestitionen in Werkzeuge, doch der Nutzen ist klar
      • Die Herstellungskosten pro Figure-03-Einheit sinken drastisch, und mit steigenden Produktionsmengen verbessert sich die Wirtschaftlichkeit
  • Um Figure 03 zu skalieren, musste Figure eine vollständig neue Lieferkette für eine Branche aufbauen, die derzeit noch nicht existiert
    • Für viele kritische Module über Aktuatoren, Akkus, Sensoren, Strukturen und Elektronik hinweg wurde vertikale Integration gewählt; alles wurde vollständig intern entwickelt
    • Bei Einzelkomponenten wurden Lieferanten strategisch identifiziert und Partnerschaften aufgebaut, die die benötigten Volumina, Zeitpläne und die strengen Qualitätsstandards des Teams erfüllen können
    • Das Ergebnis dieser einjährigen Arbeit ist ein globales Partnernetzwerk, das gemeinsam mit Figure wachsen und unter einem aggressiven Hochlaufplan Tausende bis schließlich Millionen von Teilen produzieren kann
  • BotQ ist Figures eigene Fertigungsanlage zur Skalierung der Roboterproduktion
    • Die Fertigungslinie der ersten Generation von BotQ kann anfangs bis zu 12.000 humanoide Roboter pro Jahr produzieren
    • Für die nächsten vier Jahre liegt das Ziel bei insgesamt 100.000 Robotern
    • Statt auf Auftragsfertiger zu setzen, holt Figure die Produktion der wichtigsten Systeme ins eigene Haus, um strenge Kontrolle über Qualität, Iteration und Geschwindigkeit zu behalten
    • Die Anlage verfügt über modernste Systeme und digitale Integration und basiert auf einem intern entwickelten Manufacturing Execution System (MES)
      • Alle Unterbaugruppen und die Endmontage durchlaufen diese Linie mit vollständiger Rückverfolgbarkeit, um Qualität, Wiederholbarkeit und kontinuierliche Verbesserung sicherzustellen

Für globale Größenordnung entwickelt

  • Figures Fokus auf den Haushaltsmarkt schmälert das Potenzial von Figure 03 für den kommerziellen Markt in keiner Weise
    • Durch die Bewältigung der Variabilität und Schwierigkeit des Haushalts entwickelt Figure ein echtes Universalprodukt, das im Arbeitsmarkt eine möglichst große Bandbreite von Aufgaben übernehmen kann
  • Figure 03 ist aus mehreren Gründen für kommerzielle Anwendungen geeignet
    • Die Aktuatoren erreichen die doppelte Geschwindigkeit bei verbesserter Drehmomentdichte (nm/kg)
    • Das wichtigste Ergebnis davon ist die Fähigkeit, Gegenstände schneller zu picken und zu platzieren
  • Die Verbesserungen an Hand- und Sensorsystem für Helix haben große Bedeutung für kommerzielle Anwendungsfälle
    • Dank Upgrades bei Kameras und Perception-System kann Figure 03 kommerzielle Umgebungen intelligent navigieren und präzise Manipulation ausführen
    • Die oben hervorgehobenen Änderungen an der Hand – mehr Nachgiebigkeit, größere Fingerspitzenfläche und taktile Sensorik – ermöglichen besseres stabiles Greifen unterschiedlichster Objekte, etwa kleiner Blechstücke oder verformbarer Polybeutel
  • Dank induktivem Laden ist mit Figure 03 nahezu kontinuierlicher Betrieb möglich, wenn das System in Nutzungspausen einfach auf der Ladematte steht
    • Schneller kabelloser Daten-Offload erlaubt es dem Roboter, während Schichtpausen nahtlos Daten abzuladen, indem er lediglich zur Dockingstation zurückkehrt
  • Kommerzielle Kunden können für ihre Figure-03-Flotten eigene Uniformen entwerfen
    • Möglich sind langlebigere oder schnittfestere Materialien sowie weitere Designanpassungen für bestimmte Umgebungen
    • Die neuen seitlichen Displays von Figure 03 ermöglichen schnelle Identifikation in großen Flotten und lassen sich vollständig an Branding oder operative Anforderungen jedes Kunden anpassen

Fazit

  • Figure 03 stellt einen beispiellosen Fortschritt dabei dar, humanoide Roboter von experimentellen Prototypen zu einsatzfähigen und skalierbaren Produkten zu machen
    • Durch die Kombination fortschrittlicher Wahrnehmung und taktiler Intelligenz mit haushaltstauglichem Sicherheitsdesign und Vorbereitung auf die Massenproduktion baut Figure eine Plattform auf, die in Haushalten und kommerziellen Umgebungen lernen, sich anpassen und arbeiten kann
  • Figure 03, entwickelt für Helix, den Haushalt und globale Skalierung, schafft die Grundlage für einen echten Universalroboter – mit dem Potenzial, die Art und Weise zu verändern, wie Menschen leben und arbeiten

1 Kommentare

 
GN⁺ 2025-10-10
Hacker-News-Kommentare
  • Es wird darauf hingewiesen, dass alle Videobeispiele sorgfältig ausgewählte Szenen sind; fragt man Leute, die tatsächlich an humanoiden Robotern forschen, ist die Ausfallrate bei Wiederholungen hoch und der Erfolgsweg sehr schmal; würde man Roboter verschiedener Firmen holen, ihre Fähigkeiten vorab prüfen und dann eine Benchmark-Umgebung schaffen, die nicht in den Trainingsdaten vorkam, könnte man die tatsächliche Ausfallrate sehen; aktuell ist das nicht mehr als die Phase technischer Demos; der Großteil des Trainings findet in Simulationen statt, die Physik nur annähern, und der Rest wird von Menschen per Joystick direkt gesteuert; alle manuellen Handbewegungen fallen darunter und die Fehlerrate ist beträchtlich

    • Die Aufgabe im letzten Video, „eine Kiste aus einem Paketstapel greifen und so aufs Förderband legen, dass das Etikett nach unten zeigt“, wirkt am realistischsten; ich habe auf Twitter ein ungeschnittenes Video gesehen, in dem das frühere Modell dies eine Stunde lang wiederholt ausführt (Link); ein humanoider Roboter ist dafür vielleicht nicht zwingend nötig, aber die Fähigkeit, verschiedenartige Pakete zu greifen, zu manipulieren und Fehler zu korrigieren, ist durchaus beeindruckend

    • Genau das ist der Punkt: Wenn dieser Roboter das kann, gibt es klare Einsatzfälle wie das Auffüllen von Regalen im Einzelhandel; Pick-and-Place-Arbeiten haben begrenzte Randbedingungen, erfordern Mobilität wie beim Menschen und finden in Umgebungen statt, die für humanoide Formen geeignet sind; ich frage mich, wie weit man wirklich ist; das wurde schon 2020 versucht (Link) und auch 2022 (Link) mit einem kettengetriebenen Roboter bei 7-Eleven Japan; Roboter, die durch Läden fahren, Regale visuell inspizieren und mit Planogrammen vergleichen, sind bereits recht verbreitet; sie manipulieren die Produkte aber nicht direkt; Systeme zur Unterstützung der Bestandsplanung gibt es bereits; ein Forschungsteam der TU Delft behauptet, dass das in fünf Jahren möglich sei (Link), allerdings ohne klaren Zeitbezug der Quelle

    • Das fasst gut zusammen, was ich sagen wollte; in Wirklichkeit dienen all diese Videos dem Marketing; nachdem ich das Logistics-Video gesehen habe (Link), würde ich gern sehen, wie dieses Modell Hausarbeit ausprobiert; das wird sicher überhaupt nicht reibungslos laufen und es wird viele Fehler und Fehlschläge geben; nicht im negativen Sinn, sondern weil ich mir wünsche, dass man genau das unverfälscht zeigt; wenn das nächste Video kommt, werde ich es mir auf jeden Fall ansehen

    • So war es schon immer; die Firma existiert erst seit wenigen Jahren; ich gehöre zwar nicht zum Humanoiden-Lager, aber irgendwo muss man anfangen; leider gilt für Fundraising fast immer „Übertreibung > Wahrheit“, deshalb bekommt man solche kuratierten Videos zu sehen

    • Ich habe ein Video gesehen, in dem reale Amazon-Paketsortierung eine Stunde am Stück ausgeführt wurde (Link); ich frage mich, wie sich die obige Behauptung damit vereinbaren lässt

  • Die Kommentare hier wirken mir viel zu negativ; vor fünf Jahren war so etwas noch völlig unmöglich; jetzt sehen wir bereits Consumer-Roboter-Demos, die bald nach einigen Wiederholungen den Großteil der Hausarbeit ohne Probleme erledigen könnten; es verändert sich gerade sprunghaft, wie wenn ein Frosch plötzlich sehr schnell kocht

    • Du sagst, das sei vor fünf Jahren unmöglich gewesen, aber Boston Dynamics zeigt seit 20 Jahren echte Produktdemos, keine übertriebene Werbung; kein einziges davon hat bislang zu breiter realer Nutzung in einem Massenmarkt geführt; man kann optimistisch bleiben und trotzdem verstehen, warum alle so vorsichtig sind

    • Bevor ein Ziel erreicht ist, weiß niemand, wann es so weit sein wird; manches skaliert plötzlich wie das Smartphone, anderes bleibt jahrzehntelang ohne Durchbruch wie Kernfusion; humanoide Roboter ähneln eher letzterem, deshalb jubeln die Leute nicht mehr sofort bei jedem neuen Fortschritt; wenn später ein echter Durchbruch kommt, werden alle sagen, das sei der „echte“ gewesen, aber davor bleibt man skeptisch

    • Du sagst, „nach ein paar Wiederholungen werden sie den Großteil der Hausarbeit problemlos erledigen“, aber vermutlich verschwinden bis dahin auch die Klempnerjobs, die man uns als Alternative zu durch LLM ersetzten White-Collar-Jobs empfohlen hat

    • Es wird zwar von reproduzierbaren Demos und schneller Entwicklung gesprochen, aber vieles ist noch immer teuer oder kann in realen Umgebungen nicht selbstständig lernen und arbeiten; dies ist nun schon das x-te Video eines Hemden-faltenden Roboters, aber ich habe noch nie gesehen, wie er in einem unaufgeräumten Zimmer oder aus einem Wäscheberg heraus arbeitet; ich hatte erwartet, der erste KI-Roboter würde ein Haustier sein, aber wir sind offenbar noch nicht einmal auf Furby-Niveau

  • Selbst wenn solche Roboter alle Hausarbeiten erledigen würden, mache ich mir Sorgen, dass meine Privatsphäre dem Hersteller offengelegt wird; wenn man sich Fälle von Sicherheitsverletzungen bei Ring-Kameras ansieht (Link), wird klar, dass ein mobiler Roboter noch viel gravierender in die Privatsphäre eingreifen könnte; wenn ich so etwas kaufe, brauche ich ernsthafte Garantien beim Datenschutz

    • Bei einem Roomba-Modell mit Kamera wurden peinliche Bilder an den Hersteller übertragen und Mitarbeiter teilten das Material in sozialen Netzwerken; so etwas ist also bereits passiert; es gab auch mal ein Kamera-Drohnen-Sicherheitssystem für Häuser, aber ich weiß nicht, was daraus geworden ist; ich hatte befürchtet, dass es zu vielen Arten von Privatsphäre-Lecks kommen würde (Link)

    • Bei Figure 03 heißt es, 10Gbps-mmWave-Daten-Offloading ermögliche es der gesamten Flotte, Terabytes an Daten für kontinuierliches Lernen hochzuladen; an der Stelle war ich sofort raus

    • Datenschutz einmal beiseite: Ich stelle mir vor, was passiert, wenn jemand wie @elder_plinius bei mir zu Hause auftaucht; das Thema AI Safety wird in dem Moment viel realer, in dem KI einen Körper bekommt

    • Am meisten Angst macht mir die Vorstellung, dass das Ding aus der Ferne gehackt wird und mich verletzt, während ich schlafe

    • Ich hätte gern, dass man es so programmiert, dass der Roboter den Raum sofort verlässt, wenn Familienmitglieder hereinkommen, und nur in Räumen putzt, die gerade leer sind

  • Die Leute sind extrem kritisch; man sollte bedenken, dass dies der schlechteste Zustand ist, in dem diese Roboter je sein werden; sobald ein Roboter bei einer Aufgabe Fortschritte macht, kann die ganze Flotte dieses Lernen teilen; künftig wird es also immer besser werden

    • Auch wenn ich weiß, dass die Videos manipuliert oder sorgfältig ausgewählt sind, ist dieser Fortschritt erschreckend beeindruckend; dass die Leute das so negativ sehen, überrascht mich fast mehr

    • Ich bezweifle den technischen Fortschritt an sich nicht, aber persönlich kann ich nicht mehr positiv darauf blicken, weil technischer Fortschritt sich gefühlt blitzschnell in etwas Dystopisches verwandelt hat; ich denke, daher kommen viele der negativen Reaktionen; natürlich machen sich manche vielleicht auch einfach Sorgen um eine Investitionsblase

  • Ich verstehe nicht, warum man laden muss; man könnte drei Batterien mit je einem Drittel der Kapazität einbauen und jede separat laden lassen, sodass der Roboter zur Station geht und nur die Batterien austauscht; ich verstehe nicht, warum man unbedingt kabelloses Laden oder ein Kabel verwenden sollte; Batteriewechsel erscheint mir viel sinnvoller; noch besser wäre es, wenn der Roboter anhand von Batterielebensdauer-Daten den Austausch und das Recycling selbst organisiert; stünde die Ladestation draußen unter Solarpanels, könnte man sogar Stromkosten sparen; beim Laden oder Batteriewechsel könnte er die Tür selbst verriegeln und bei schlechtem Wetter das ganze Setup ins Haus holen

    • Das hängt von der Batterielebensdauer ab; wenn er den ganzen Tag durchhält, ist es sinnvoll, ihn nachts auf ein Pad zu stellen und zu laden; austauschbare Batterien bedeuten mehr Gewicht und weniger Freiheit bei der Platzierung der Batterien; außerdem ist die Ladegeschwindigkeit wichtig: Wenn in 30 Minuten 80 % erreicht werden, kann man zwischen größeren Aufgaben kurz nachladen; wenn induktives Laden unter den Füßen möglich ist, könnte man ihn auf eine große Ladematte stellen und in Fabrikumgebungen praktisch unbegrenzt betreiben; wenn Wäschefalten oder Geschirrspülen 30 Minuten dauert, könnte dort einfach eine Ladematte liegen, sodass er während der Arbeit lädt; vielleicht haben künftige Neubauten sogar in jedem Boden integrierte Ladespulen

    • Batteriewechsel erfordert zusätzliche bewegliche Teile und ein spezielles Gehäuse; auch die Batterie selbst müsste robuster sein und man bräuchte mindestens zwei davon; ein Kabel einzustecken könnte der Roboter womöglich selbst schaffen, aber realistisch ist die Umgebung zu unvorhersehbar und das Kabel könnte im Weg sein (wobei induktive Ladegeräte natürlich ebenfalls gestört werden können ...)

    • Der plausibelste Grund ist wohl, dass selbst in vorprogrammierten Situationen ein Batteriewechsel an einer festen Position noch zu schwierig ist; sogar ein Ladekabel selbst einzustecken ist unmöglich; trotzdem wird es so dargestellt, als könne das Ding Wäsche falten, was die reale Machbarkeit überzeichnet; wenn ich so eine Ankündigung sehen würde, würde ich sofort die Aktien verkaufen

    • Man sollte auch bedenken, was passiert, wenn der Batteriewechsel scheitert und der Roboter nicht mehr zur Ladestation kommt; dann muss man womöglich ein 150 cm/300 kg-Gerät unter dem Sofa hervorziehen wie einen steckengebliebenen Saugroboter

    • Walker S2 scheint den Tausch in einer Demo gut zu beherrschen (Link)

  • Ich finde den Vergleich mit GPT-2 interessant; oberflächlich ist das eine schicke Analogie, aber im Kern ist es völlig anders; bei GPT existierten Trainingsdaten wie Webdokumente und Bücher bereits im Voraus, auch die Rechenressourcen waren schon da; letztlich war es ein „Kombinationsspiel“, bei dem bestehende Ressourcen gesammelt wurden, um die Idee aus einer Arbeit von 2017 in die Praxis umzusetzen, und als man es ausprobierte, funktionierte es; bei humanoiden Robotern hingegen existieren die realen Daten, die für das Training neuronaler Netze nötig wären, in diesem Maßstab praktisch nicht, und die Natur der Daten ist viel komplexer als einfache Token-Vorhersage; trotzdem unterstütze ich den Pioniergeist des Figure-Teams; die kuratierten Beispiele sind offensichtlich, aber da es nicht um Produktverkauf geht, sondern darum, Investoren über F&E und Forschung zu informieren, halte ich das am Ende für förderlich für Innovation

    • Es wird eine Struktur vorgeschlagen, in der RL in simulierten Umgebungen ausgeführt wird und ein visuelles LLM die Validierung übernimmt (Zustandsprüfung über 2D-Bilder, Rückgabe von 0 oder 1 durch ein Vision-Language-Model), sowie die Idee, Video-Erweiterungsmodelle wie Sora auf Aufgaben von Waschmaschine bis Trockner anzuwenden und sie mit einer FPV-basierten Vorhersagestruktur einzusetzen

    • Nicht direkt zum Inhalt passend, aber es werden einige nützliche verwandte Forschungslinks geteilt
      Link1
      Link2
      Link3
      Link4

    • Geht das nicht davon aus, dass die bisherigen Trainingsmethoden einfach fortgeschrieben werden? Wahrscheinlich braucht man Wege, direkt aus der Umgebung zu lernen; in jüngerer Forschung wurden Architekturen vorgeschlagen, aus denen so eine allgemeine Intelligenzstruktur entstehen könnte; allerdings habe ich in diesem Bereich noch keine ausreichend großen Investitionen oder Versuche gesehen

  • Die im Video gezeigten Anwendungsfälle sind interessant; da die Welt für Menschen entworfen wurde, denke ich, dass menschenähnliche Roboter gut passen; es ist ein Vorteil, dass man nicht die Waschmaschine oder das ganze Haus an den Roboter anpassen muss; aber Roboter in Tätigkeiten wie dem Hotelempfang einzusetzen, wo menschliche Qualitäten wichtig sind, ist Unsinn; wenn man die Vorteile von Menschen, also Stimmung und Vertrautheit, vollständig entfernt, ist ein Kiosk schlicht viel besser und praktischer

    • Ich habe darüber nachgedacht, ob man eher Menschennähe oder Effizienz anstreben sollte; in vielen Fällen haben wir uns eher für Effizienz entschieden; wenn Roboter irgendwann verschiedenste Aufgaben vollständig erledigen, entfällt auch der Grund, menschenzentrierte Räume beizubehalten, und damit wohl auch der Vorteil humanoider Formen; auch Logistiklager sind heute noch wegen Menschen menschzentriert, aber bei vollständiger Automatisierung würde dieses Kriterium wegfallen

    • Ich war vor ein paar Jahren beruflich in Las Vegas und war beeindruckt, wie stark Check-in und Check-out im Hotel automatisiert waren; am Kiosk zeigte man nur Code und Reisepass, wählte die gewünschten Optionen, bekam die Zimmerlage angezeigt oder ausgedruckt und die Schlüsselkarte ausgestellt; gefühlt konnten vier Kioske über 90 % der Arbeit von vier Angestellten übernehmen, und auch das Wartegefühl war ein anderes; allerdings fallen auch Kioske oft aus, wie man an Flughäfen sieht; und beim Thema Waschmaschine ist Standardisierung im Smart Home die richtige Antwort; mit Technologien wie Thread sollte ein „Hausbot“ den Zustand nicht selbst prüfen müssen, sondern ihn in Echtzeit direkt gemeldet bekommen

    • Ich predige seit Langem, dass Check-in in Hotels und bei Mietwagen automatisiert werden sollte; kürzlich habe ich bei einem Mietwagenanbieter tatsächlich ein solches System genutzt, und es lief nicht reibungslos; das System erkannte den Code nicht, ich brauchte mehrfach Hilfe vom Personal, und dann wurde mir auch noch der falsche Schlüssel zugewiesen; am Ende musste doch wieder ein Mensch eingreifen; die Idee ist gut, aber die Umsetzung war mangelhaft

    • Ironischerweise könnte ein laufender Roboter als „Computer, der sich selbst bewegen kann“ am realistischsten sein; als mobiler Server, Lautsprecher oder Unterbau für Datenerfassung wäre er äußerst nützlich, wenn er sich im Feld selbst positionieren könnte und so 15 % des Gehirns von lästigen Aufgaben befreit; (um noch einmal auf das Thema Hotel-Schlüsselkarten zurückzukommen: Technisch hätte der Kartenleser auch als Kreditkartenleser dienen können, praktisch prüft das Personal aber oft auch den Zustand und die Sicherheit des Gasts mit den eigenen Augen, weshalb reine Automatisierung nicht so einfach ist)

    • Manche Menschen mögen das menschliche Element an der Rezeption nicht; wenn möglich, wären sie sogar bereit, extra zu zahlen, um nur einen QR-Code oder Pass zu erhalten und ohne jeden menschlichen Kontakt direkt aufs Zimmer zu gehen

  • Techniker scheinen nicht zu verstehen, warum Menschen ineffiziente, aber höherstufige Werkzeuge wie Humanoide gegenüber niedrigstufigen, hocheffizienten Werkzeugen bevorzugen; um etwa einen Geschirrspüler zu nutzen, muss man ihn kaufen, installieren und die Anleitung verstehen, aber es ist viel intuitiver, einfach zu einer Person zu sagen: „Spül bitte das Geschirr“; selbst wenn das Ergebnis etwas schlechter ist, sind viele bereit, deutlich mehr Geld zu zahlen; es liegt in der menschlichen Natur, nicht immer Zeit und Mühe für maximale Effizienz investieren zu wollen

    • Das gilt selbst bei der Anstellung realer Menschen; auch wenn die Stundenkosten höher sind und die Leistung geringer, vermeidet man dadurch viele der Komplexitäten, die mit dem Beschäftigen von Mitarbeitern einhergehen; (ich sage nicht, dass das eine gute Idee ist, ich betrachte es nur aus Kostensicht)

    • Allerdings sind die Grenzen davon auch klar; für das Spülen kann man schon heute, wenn man nur zahlt, die maximal effiziente und maximal flexible Haushaltshilfe bekommen; wenn es so etwas wie einen automatenhaften Diener gäbe, der viele Hausarbeiten übernimmt, frage ich mich insgeheim, in welchem Bereich zwischen $1k und $100k ein realer Kaufwert liegen könnte und wie stark Zusatzkosten, Zuverlässigkeit und andere Variablen das beeinflussen; ich frage mich auch, wie groß der Kreis der „vielen Menschen“, die so etwas bevorzugen würden, tatsächlich wäre

  • Das Design des Roboters selbst ist schwierig, aber die wirkliche Herausforderung ist die „Deployment“-Phase, also der echte Einsatz; entscheidend ist, wie viele Geräte wo und für welche Arbeiten eingesetzt werden; man muss beobachten, welche Aufgaben in der Praxis wirklich taugen, wie gut sich das System an unterschiedliche Einsatzumgebungen anpasst und wie es sich über die Zeit verändert; die größte Hürde bei allgemeinen Robotern war immer die KI; wenn Figure tatsächlich hochentwickelte, vielseitige KI hervorbringt, die sofort in breiten Umgebungen eingesetzt werden kann und bei unterschiedlichen Aufgaben direkt Leistung bringt, wäre das ein Riesenerfolg; wenn man die tatsächlichen Deployments verfolgt und sieht, ob sie in kleinen Firmen, komplexen Räumen wie Bau und Wartung, beim Entladen von Walmart-Lkw oder beim Auffüllen von Ladenregalen problemlos eingesetzt werden, dann ist es echt

    • Realistisch gesehen werden die ersten Einsätze eher so aussehen wie der glatt präsentierte siebenminütige Trailer: als Champagner-Butler auf Partys, Hotelrezeptionsroboter und andere kuriose Spielzeuge für Wohlhabende; für ernsthafte Einsätze im Walmart-Maßstab braucht es wahrscheinlich noch einige Generationen mehr
  • Wenn solche Roboter einmal in der Preisklasse von 30 Millionen Won auf den Markt kommen, wird wohl jedes Haus einen haben; zusammen mit Kernfusion hoffe ich, dass Heimroboter zu einer der prägenden Technologien unserer Generation werden; lange war das reine Fantasie, aber ich glaube, innerhalb meines Lebens wird das endlich realistisch und wirtschaftlich; der Gedanke an einen Roboter im Haus erfüllt mich zugleich mit Angst, Ehrfurcht und Unbehagen

    • Das Datenschutzproblem muss zwingend gelöst werden; theoretisch sollte der Roboter nur mit einem Server kommunizieren dürfen, der in meinem eigenen Keller steht

    • Ich rechne auch damit, dass es irgendwann Schlagzeilen über solche Roboter geben wird, die nach einem Hack für schwere Verbrechen missbraucht werden

    • Weil der Nutzen von Hausarbeit begrenzt ist, wird es vor einem ausreichend niedrigen Preis wohl keine breite Akzeptanz geben; ich würde keine 30 Millionen Won ausgeben, damit jemand mein Geschirr spült oder die Waschmaschine bedient; technikaffine Wohlhabende kaufen so etwas vielleicht aus Faszination, aber die breite Masse wird weiterhin auf das Preis-Leistungs-Verhältnis schauen; früher verkaufte sich der günstige Roboterstaubsauger Luba wie geschnitten Brot, heute steht er vielerorts nur noch herum; die stärksten Einsatzfelder für Roboter liegen in Industrie, Fertigung, Bau und Landwirtschaft, und dafür braucht es nicht zwingend eine humanoide Form; im Gegenteil könnte genau dieses Aussehen den Widerstand von Gewerkschaften verstärken; vielleicht wird eher etwas begrüßt, das wirklich einfach wie ein Werkzeug aussieht

    • Den gesamten Smart-Home-Trend habe ich ohnehin ausgelassen, und ich werde wahrscheinlich auch diesen Hype überspringen; ich spüle und wasche einfach weiter selbst wie bisher