- Die Robotikbranche befindet sich derzeit auf dem GPT-2.5-Niveau: Foundation-Modelle zeigen bereits reale Fähigkeiten, doch die Lücke zwischen Laborergebnissen und Auslieferung im Feld ist weiterhin groß
- Selbst die von Goldman Sachs binnen eines Jahres um das 6-Fache nach oben korrigierte Prognose eines 38-Milliarden-Dollar-Markts im Jahr 2035 hält Bessemer für konservativ; allein die Kosten für Robotikdaten dürften in den kommenden zwei Jahren branchenweit mehr als 3 Milliarden US-Dollar betragen
- 48 % der Gründer US-amerikanischer Robotikunternehmen stammen von den vier Institutionen Stanford, MIT, Berkeley und CMU, was eine Winner-takes-all-Dynamik durch Talentkonzentration beschleunigen dürfte
- Der Median der Series-A-Runden von Defense-Robotikunternehmen liegt mit 105 Millionen US-Dollar beim Doppelten von Nicht-Defense-Unternehmen; mit Andurils Bewertung von 60 Milliarden US-Dollar wird erwartet, dass der erste IPO über 50 Milliarden US-Dollar aus diesem Bereich kommen wird
- In den vergangenen fünf Jahren erhielten nur 42 Robotikunternehmen Investments von mehr als 30 Millionen US-Dollar — ein Achtzehntel des Software-Niveaus —, was eher auf strukturelle Unterinvestition als auf eine Robotikblase hindeutet
Strukturelle Nachfrage und Marktausblick für Robotik
- Die Nachfrage nach dem Ersatz menschlicher Arbeit bei repetitiver körperlicher Tätigkeit oder in gefährlichen Arbeitsumgebungen steigt aufgrund demografischer Veränderungen in den USA, Europa, Japan und China weiter an
- Einige Analysten prognostizieren, dass der Robotikmarkt bis 2035 auf 38 Milliarden US-Dollar wachsen wird; Goldman Sachs hat diese Prognose innerhalb eines Jahres um das 6-Fache angehoben
- Bessemer hält selbst diese Prognose sowohl hinsichtlich Tempo als auch Größenordnung für konservativ
- Bessemer-Partner Jeremy Levine sagte: „In den nächsten 10 bis 20 Jahren wird es auf der Erde 100.000-mal mehr Roboter als heute geben“
- Bessemer sieht Investmentchancen zu einem Zeitpunkt, an dem sich Talentbewegungen, technologische Durchbrüche und struktureller Rückenwind gleichzeitig beschleunigen, und nennt im Portfolio unter anderem Waymo, Mind Robotics, Foxglove, Breaker, Noda, Voxel51, DroneDeploy, Auterion, Perceptron und ANYbotics
Prognose 1: Der ChatGPT-Moment der Robotik kommt näher, ist aber noch nicht da
- Die Robotikbranche befindet sich in einem GPT-2.5-Moment: Foundation-Modelle zeigen praktische Fähigkeiten, Skalierungsgesetze werden sichtbar, doch die Lücke zwischen Forschungsdemos und produktivem Einsatz ist weiterhin groß
- Das π0-Modell von Physical Intelligence hat erfolgreich Wäsche mit menschenähnlicher Geschicklichkeit gefaltet
- Das im Februar 2026 veröffentlichte EgoScale-Paper belegt, dass sich die Policy-Performance mit dem Umfang der Pretraining-Daten vorhersagbar verbessert, und liefert damit den ersten starken Hinweis darauf, dass Robotik-Foundation-Modelle derselben datengetriebenen Verbesserungskurve wie LLMs folgen
- Es gibt zwei zentrale ungelöste Fragen
- Wie viele Daten nötig sind, um die Lücke zwischen Laborleistung und der in der Produktion geforderten Zuverlässigkeit von 99,9 % zu schließen
- Wie der ChatGPT-Moment der Robotik konkret aussehen wird, wenn er eintritt
- Anders als bei Chatbots lässt sich die Leistungsfähigkeit nicht in einem Textfeld demonstrieren; der Beweis wäre ein Roboter, der in einer unbekannten Umgebung ohne menschliches Eingreifen komplexe Aufgaben ausführt
- Bereits kommerzialisiert sind Bereiche wie Lagerautomatisierung, OP-Assistenz, Last-Mile-Delivery und industrielle Inspektion — also zweckgebundene Systeme in begrenzten Umgebungen, die heute schon Umsatz generieren
- Perceptron-CEO Armen Aghajanyan: „Der Kern realweltlicher Robotik sind nicht bessere Regelalgorithmen, sondern Foundation-Modelle, die die physische Welt verstehen; die Robotersteuerung ist nur eine dünne Schicht darüber“
Prognose 2: Das Auftreten von Skalierungsgesetzen — Daten sind teuer, Kapital ist der Burggraben, und World Models könnten die Abkürzung sein
- LLMs konnten auf Hunderte Billionen Token aus dem Internet zugreifen, doch für die Robotik gibt es kein entsprechendes Korpus
- Das weltweite Datenvolumen für Roboter-Manipulation wird auf etwa 300.000 Stunden geschätzt; verglichen mit rund 1 Milliarde Stunden Internetvideo und 300 Billionen Token Text besteht eine strukturelle Lücke
- Bessemer schätzt, dass die gesamten Robotik-Datenkosten der Branche in den kommenden zwei Jahren mehr als 3 Milliarden US-Dollar erreichen werden
- Einschließlich Teleoperation, egonzentrischer Videos, Simulationen und physischer Demonstrationsdaten
- Robotikdaten lassen sich nicht scrapen oder einkaufen, sondern müssen pro Aufgabe und pro Umgebung direkt erzeugt werden
- Zeromatter-CEO Ian Glow: „Mit Teleop allein lässt sich keine erfolgreiche Datenstrategie aufbauen; man muss Daten über Reinforcement Learning aus dem Internet oder aus Simulatoren holen, um die nötige Größenordnung und Vielfalt zu erreichen“
- World Models: neuronale Netze, die aus internetgroßen Videomengen die Gesetze der Physik lernen
- V-JEPA 2 von Meta wurde mit mehr als 1 Million Stunden Video trainiert und erreichte mit nur 62 zusätzlichen Stunden Roboterdaten auf einem realen Roboterarm 80 % Zero-Shot-Erfolgsquote bei Pick-and-Place
- Allerdings nutzte Cosmos von NVIDIA für das Training 10.000 H100-GPUs über drei Monate; auch World Models sind somit ein kapitalintensiver Ansatz
- Simulation und Reinforcement Learning: Für Lokomotion funktioniert der Übergang von Sim zu Real gut, bei Manipulation bleibt er wegen Problemen bei der Abbildung von weichen Objekten, Stoffen und Flüssigkeiten weiterhin eine ungelöste Forschungsfrage
- Voxel51-CEO Brian Moore: „Was in Physical AI Vorreiter von Blendern trennt, ist die Besessenheit von Datenqualität; schlechte Daten sind nicht nur ineffizient, sondern riskant“
Prognose 3: Talentkonzentration entscheidet schnell über die Gewinner — das ist kein Markt, in dem 50 Unternehmen erfolgreich sein werden
- Von den US-Robotikunternehmen, die in den vergangenen fünf Jahren gegründet wurden und mehr als 30 Millionen US-Dollar eingesammelt haben, besitzen 43 % der Gründer einen Doktortitel
- Davon stammen 48 % von den vier Institutionen Stanford, MIT, Berkeley und CMU
- 56 % haben mindestens einen Mitgründer mit Doktortitel, 43 % Gründer mit direktem akademischem Hintergrund
- Der Talent-Burggraben erzeugt einen Zinseszinseffekt in der Reihenfolge Talent → Kapital → Datenpartnerschaften → Kundenbeziehungen → proprietäre Datensätze, wodurch sich eine Winner-takes-all-Struktur schneller bildet, als die meisten erwarten
- Im LLM-Bereich hat Open Source (Llama, Mistral) den Zugang zu Fähigkeiten demokratisiert; in der Robotik wachsen Open-Source-Projekte wie LeRobot, Genesis und Isaac Lab, doch die physische Reibung bleibt bestehen: „Man braucht immer noch Roboter“
- Teams mit der tiefsten Expertise in Bereichen wie Sim-to-Real-Übergang, Manipulation, Lokomotion und Sensor Fusion bauen Vorteile auf, die sich nicht einfach durch Open-Source-Releases kopieren lassen
Prognose 4: Full-Stack-Unternehmen schöpfen kurzfristig Wert ab — reine Foundation-Model-Unternehmen müssen warten
- Bei LLMs konnte selbst ein Zwei-Personen-Team mit einem einzigen API-Endpunkt wie GPT-4 sofort Frontier-AI-Produkte bauen; in der Robotik braucht es hingegen domänenspezifische Datenerhebung, umgebungsspezifisches Fine-Tuning, Hardware-Integration und operative Infrastruktur
- Die heutigen Burggräben liegen weniger in der Modellarchitektur als in proprietären Datenpipelines, Domänenexpertise, Deployment-Infrastruktur und Kundenbeziehungen, die Feedback-Loops erzeugen
- Sinkende Hardwarekosten beschleunigen diese Dynamik
- DroneDeploy-CEO Mike Winn: „Bodenroboter für das Bauwesen sind von 100.000 auf unter 15.000 US-Dollar pro Einheit gefallen, Docking-Drohnen von 200.000 auf unter 20.000 US-Dollar — damit wird gerade die Schwelle für skalierbares Deployment überschritten“
- Der Stack trennt sich in drei Schichten
- Infrastrukturschicht: Foundation Models, World Models
- Applikationsschicht: Full-Stack-Unternehmen mit Custom Hardware (Humanoide, Industriesysteme) sowie Full-Stack-Unternehmen, die AI auf kommerzielle Standardplattformen anwenden
- Der Wert konzentriert sich auf die Applikationsschicht, weil die Infrastrukturschicht noch nicht generisch genug ist, um End-to-End-Deployment eigenständig zu unterstützen
- Wenn sich Foundation Models verbessern und Sim-to-Real-Übergänge reifen, wird der API-Moment der Robotik kommen, doch das ist eher ein Thema für die Zeit nach 2028; im aktuellen Zeitfenster schafft vertikale Integration nachhaltigen Wert
- Foxglove-CEO Adrian Macneil: „Der entscheidende Vorteil in Physical AI ist nicht die Neuartigkeit des Modells, sondern die Qualität der Dateninfrastruktur; je stärker sich Modelle angleichen, desto eher gewinnen Unternehmen mit dem stärksten Daten-Flywheel“
Prognose 5: Defense-Robotik wird den ersten IPO dieser Kategorie über 50 Milliarden US-Dollar anführen
- Der Median der Series-A-Runden von Defense-Robotikunternehmen lag 2025 bei 105 Millionen US-Dollar, mehr als doppelt so hoch wie bei Nicht-Defense-Unternehmen mit 50 Millionen US-Dollar; diese Lücke wächst seit 2021 jedes Jahr
- Anduril schloss im März 2026 bei einer Bewertung von 60 Milliarden US-Dollar, Saronic sammelte im selben Monat eine Series D über 1,75 Milliarden US-Dollar für autonome Schiffahrt ein
- Beschaffungszyklen im Verteidigungsbereich sind lang, aber planbar; Vertragsvolumina sind groß, Verlängerungsraten hoch und Wechselkosten erheblich
- Anders als in der kommerziellen Robotik orientieren sich Defense-Käufer nicht am ROI, sondern an einer anderen Rechnung: nationales Sicherheitsrisiko
- Verstärkt wird das durch die Geopolitik: Rund 90 % der 2025 weltweit verkauften humanoiden Roboter stammen aus China
- Chinesische AI-Modelle liegen im Schnitt etwa 7 Monate hinter US-Modellen, doch dieser Abstand schrumpft stetig; die US-Regierung beginnt, Robotik als notwendigen Bestandteil der nationalen Sicherheit zu behandeln
- Unter dem Aspekt des Dual Use bauen die defensivsten Unternehmen keine Einzweck-Waffensysteme, sondern autonome Plattformen, Wahrnehmungssysteme und Entscheidungsinfrastruktur mit kommerzieller Anwendbarkeit
- Breaker-Mitgründer Matthew Buffa: „Die spannendsten Unternehmen entscheiden sich nicht zwischen Defense und Kommerz, sondern bauen Systeme, die die Anforderungen des Verteidigungsbereichs erfüllen und zugleich kommerziell innovativ sind“
Prognose 6: Keine Robotikblase — vielmehr fließt noch nicht genug Kapital in diesen Bereich
- In den vergangenen fünf Jahren erhielten 745 Softwareunternehmen Investments von mehr als 30 Millionen US-Dollar, in der Robotik waren es nur 42 — also 18-mal weniger
- Gleichzeitig ist der zugrunde liegende Robotikmarkt 30-mal größer als die weltweiten Softwareausgaben
- Selbst unter Berücksichtigung der Kapitalintensität von Hardwaregeschäften handelt es sich um eine strukturelle Unterinvestition im Verhältnis zur Chance
- Die meisten Analysten erwarten in den kommenden zehn Jahren ein 50-faches Branchenwachstum, doch Bessemer hält selbst das für eine Schätzung, die nur auf bestehende Workflow-Automatisierung begrenzt ist und neue Kategorien wirtschaftlicher Aktivität durch General-Purpose-Roboter nicht berücksichtigt
- Nicht jedes finanzierte Unternehmen wird erfolgreich sein; einige Bewertungen sind überzogen, und Kapital wird sich auf eine kleine Zahl von Marktführern konzentrieren
- Doch Selektivität und Knappheit sind verschiedene Dinge: Das gesamte Investmentniveau in Robotik liegt weiterhin deutlich unter dem, was Größe der Chance und Geschwindigkeit des Fähigkeitsfortschritts rechtfertigen würden
- Jetzt ist das Zeitfenster, um in Schlüsselunternehmen zu investieren — noch vor dem ChatGPT-Moment und bevor sich die Talentkonsolidierung vollzieht; wer auf klaren Nachweis des Wendepunkts wartet, verpasst die Gelegenheit
- Flexion-CEO Nikita Rudin: „Die meisten Roboter, die in fünf Jahren weltweit ausgerollt sein werden, stammen nicht von heute bekannten Startups, sondern von Unternehmen, die noch gar nicht mit dem Bau von Robotern begonnen haben, aber wissen, wie man in großem Maßstab produziert“
Ungelöste Aufgaben und offene Debatten
- Zuverlässigkeitslücke: Die Verbesserung der Task-Erfolgsrate von 80 % auf 99,9 % ist kein lineares Problem
- Dafür braucht es grundlegend andere Ansätze wie taktiles Sensoring, Force Feedback und Sim-to-Real-Übergänge für Manipulation
- Argus-Systems-CEO Lisa Yan: „Aus meiner Erfahrung bei Waymo zeigt sich, dass reales Deployment mit der Zeit schwieriger wird und spezialisierte Probleme der Datenkuratierung offenlegt; die Lücke von 99 % auf 99,9 % zu schließen dauert länger, als die meisten erwarten“
- Problem der Inferenzkosten: World Models und große Vision-Language-Action-Modelle sind in der Echtzeitausführung teuer
- Textmodelle können für Tausende gleichzeitige Nutzer auf geteilter Infrastruktur batchweise ausgeführt werden, Robotikmodelle müssen jedoch für jeden Roboter alle paar Millisekunden den Zustand der Umgebung erzeugen und brauchen damit praktisch dedizierte GPU-Pipelines
- Die Inferenzkosten von LLMs sind innerhalb von drei Jahren um etwa den Faktor 1.000 gefallen; ob die Robotik einer ähnlichen Kurve folgt, wird über die kommerzielle Tragfähigkeit des Foundation-Model-Ansatzes entscheiden
- Interpretierbarkeit wird zur nächsten Infrastrukturschicht
- Allein im 1. Quartal 2026 flossen rund 6 Milliarden US-Dollar in 6 bis 7 World-Model-Unternehmen
- Vayu-Robotics-Mitgründer Mahesh Krishnamurthi: „Mit der Reife der Branche wird Interpretierbarkeit zu einem nicht verhandelbaren Faktor; derzeit sind diese Modelle Black Boxes, und es ist eine Welle von Startups zu erwarten, die Werkzeuge zu ihrer Öffnung bauen“
- Open Source vs. Closed: Bei LLMs hat Open Source die Entwicklung des Ökosystems dramatisch beschleunigt; ob dieselbe Dynamik in der Robotik gilt, wo physische Daten und Deployment-Infrastruktur genauso wichtig sind wie die Modellarchitektur, ist noch offen
- Open Source dürfte Modellarchitekturen schneller als erwartet zur Commodity machen, doch Daten- und Deployment-Schichten könnten lange genug proprietär bleiben
- Unternehmen, die verstehen, welche Teile des Stacks sie öffnen und welche sie schützen müssen, sichern sich einen strategischen Vorteil
Das Nebeneinander zweier Wahrheiten
- Cobot-CEO Brad Porter: „Der ChatGPT-Moment der Robotik kommt schneller, als die meisten denken, und wenn er da ist, wird Produktionszeit (echte Roboter, echte Aufgaben, echte Umgebungen) zum Engpass; Unternehmen, die nicht auf Demos, sondern auf Deployment optimieren, werden sich klar absetzen“
- Philipp Wu, Mitgründer eines Stealth-Robotikunternehmens: „Die Zeitachse ist deutlich länger, als die meisten erwarten; General-Purpose-Robotik liegt noch mehr als fünf Jahre entfernt“
- Diese beiden Sichtweisen widersprechen sich nicht, sondern beschreiben unterschiedliche Dimensionen: Porter den Weg zum Wendepunkt, Wu die tatsächliche Entfernung dieses Wendepunkts
- Die Implikation für Gründer: Jetzt entschlossen deployen, aber mit Blick auf den General-Purpose-Moment bauen
- Der Wendepunkt nähert sich; Talente wandern, Hardware wird zur Commodity, Dateninfrastruktur entsteht — und die Unternehmen, die Physical AI im kommenden Jahrzehnt prägen werden, werden genau jetzt gegründet und finanziert
1 Kommentare
Ich bin gespannt, welche Unternehmen auftauchen werden.