Die Hälfte des Marktes für AI-Agenten entfällt auf einen Bereich, der Rest ist noch unerschlossen

(garryslist.org)

18 Punkte von GN⁺ 2026-02-23 | Noch keine Kommentare. | Auf WhatsApp teilen

Software Engineering macht rund 50 % aller Tool-Aufrufe von AI-Agenten aus, während 16 Verticals wie Healthcare, Recht und Finanzen jeweils auf unter 5 % kommen
Die tatsächlichen Fähigkeiten von AI-Modellen reichen inzwischen für Aufgaben, für die Menschen 5 Stunden brauchen würden, doch in der Praxis liegt die Session auf dem 99,9. Perzentil nur bei etwa 42 Minuten — zwischen Fähigkeit und Vertrauen besteht also eine große Lücke
Mit wachsender Nutzungserfahrung steigt die Auto-Approval-Rate von 20 % auf über 40 %, während erfahrene Nutzer ihre Aufsichtsstrategie zugleich von Vorabfreigaben auf aktives Monitoring umstellen
Der Kern von Vertical AI liegt in proprietärer Datenintegration, domänenspezifischem Context Engineering und Change Management beim Kunden; genau das trennt bloße Wrapper von verteidigungsfähigen Unternehmen
So wie SaaS in den vergangenen Jahrzehnten mehr als 170 Unicorns hervorgebracht hat, könnten zu jedem SaaS-Unicorn entsprechende Vertical-AI-Unicorns entstehen — und die AI-Version kann nicht nur Software, sondern auch Operatoren ersetzen

Software Engineering beansprucht die Hälfte der AI-Agenten-Aktivität

Laut einer von Anthropic veröffentlichten Studie zur realen Nutzung von AI-Agenten entfallen 49,7 % aller agentischen Tool-Aufrufe auf Software Engineering
Healthcare liegt bei 1 %, Recht bei 0,9 % und Bildung bei 1,8 %; unter den 16 Verticals kommt kein Bereich über 9 %
Das bedeutet nicht, dass der Markt gesättigt ist, sondern dass er noch gar nicht richtig geformt ist
Han Wang bezeichnet dies als eine Greenfield-Chance, die von den meisten Gründern übersehen werde
Der Autor dieses Beitrags, Garry Tan, sagt dazu: Wenn er jetzt gründen würde, würde er die rote Zone in dieser Grafik genau beobachten

Laut der METR-Evaluierung können Claude-Modelle Aufgaben ausführen, für die Menschen 5 Stunden benötigen würden, doch reale Sessions dauern im Schnitt nur 42 Minuten
Die Lücke zwischen dem, was AI leisten kann, und dem, was Nutzer zulassen, schafft eine große Marktchance
Zwischen Oktober 2025 und Januar 2026 hat sich die Turn-Dauer im 99,9. Perzentil von unter 25 Minuten auf über 45 Minuten nahezu verdoppelt
- Das ist nicht nur auf bessere Modellleistung zurückzuführen, sondern auch darauf, dass Nutzer pro Session Vertrauen aufbauen
Interne Daten zeigen, dass sich die Erfolgsrate von Claude Code verdoppelt hat, während menschliche Eingriffe pro Session von 5,4 auf 3,3 gesunken sind
Die Fähigkeiten des Modells sind ausreichend, aber das Deployment hält nicht Schritt — daraus ergeben sich neue Produktchancen

Neue Nutzer genehmigen nur 20 % der Claude-Code-Sessions automatisch, aber nach 750 Sessions wechseln mehr als 40 % zur vollständigen Auto-Approval
Gegen die Intuition greifen erfahrene Nutzer nicht weniger, sondern häufiger ein — Eingriffsrate bei neuen Nutzern 5 %, bei erfahrenen 9 %
- Das ist kein Widerspruch, sondern ein Wechsel der Oversight-Strategie: Anfänger genehmigen jeden Schritt vorab, erfahrene Nutzer delegieren und greifen erst bei Problemen ein (Vorabfreigabe → aktives Monitoring)
Eine sicherheitsrelevante Beobachtung: Bei komplexen Aufgaben stellt Claude Code mehr als doppelt so häufig Rückfragen, wie Menschen eingreifen
- Der Agent läuft also nicht blind weiter, sondern stoppt selbst bei Unsicherheit
Die zentrale Lehre von Anthropic: Die tatsächlich ausgeübte Autonomie eines Agenten wird gemeinsam von Modell, Nutzer und Produkt konstruiert

Die von Aaron Levie skizzierte Formel zum Aufbau von Vertical AI:
- Das Verständnis für einzigartige Daten, Workflows und regulatorische Hürden einer Branche ist der Kern verteidigungsfähiger Unternehmen
- Es braucht mehr als einen simplen Wrapper: nötig sind Fähigkeiten für proprietäre Datenintegration, Workflow-Automatisierung und Change Management
- Aufbau agentischer Software, die an proprietäre Daten angebunden ist
- Software so gestalten, dass sie für reale Menschen und reale Probleme funktioniert
- Die Intelligenz der Ausgaben durch domänenspezifisches Context Engineering maximieren
- Was die meisten Gründer übersehen: Change Management für Kunden aktiv vorantreiben
Warum Vertical AI verteidigbar ist: Einen Wrapper kann jeder bauen, aber nur wenige können sich durch konkrete Workflows, regulatorische Einschränkungen und organisatorische Reibungen in Bereichen wie Healthcare-Abrechnung, Legal Discovery oder Baugenehmigungen navigieren
SaaS ist über Jahrzehnte hinweg pro Dekade um den Faktor 10 gewachsen; in den vergangenen 20 Jahren flossen mehr als 40 % des VC-Kapitals in SaaS, woraus mehr als 170 SaaS-Unicorns entstanden
Die Kernaussage: Zu jedem SaaS-Unicorn gibt es ein entsprechendes Vertical-AI-Unicorn, und die AI-Version könnte 10-mal größer werden, weil sie nicht nur Software, sondern auch Operatoren ersetzt

Die zentrale Erkenntnis von Anthropic:
- Autonomie ist keine inhärente Eigenschaft des Modells, sondern wird gemeinsam von Modell, Nutzer und Produkt konstruiert
- Voreinsatz-Evaluierungen allein erfassen das nicht; Messungen in realen Umgebungen sind daher unerlässlich
Sicherheitskennzahlen: Bei 73 % der Tool-Aufrufe greifen Menschen ein, und nur 0,8 % werden als irreversible Handlungen eingestuft
- Die riskantesten Einsätze (API-Key-Leaks, autonomer Kryptohandel usw.) sind meist Security-Evaluierungen und nicht echte Produktionssysteme
Eine Politik des „Genehmige jede Handlung“ beeinträchtigt nur die Produktivität, ohne die Sicherheit zu verbessern;
bessere politische Ziele bestehen darin sicherzustellen, dass Menschen überwachen und eingreifen können

Software Engineering ist bereits stark besetzt, während 16 Verticals mit einstelligen Marktanteilen — etwa Healthcare, Recht, Finanzen, Bildung, Customer Service und Logistik — noch darauf warten, dass jemand Domänenexpertise in Agenten einbaut
Früher sind 300 SaaS-Unicorns entstanden; als Nächstes werden 300 Vertical-AI-Unicorns auftauchen
Gründer, die ein Vertical auswählen, Domänenexpertise in Agenten einbauen und Change Management lösen, werden in den kommenden zehn Jahren die Enterprise-Software besitzen
Modelle können bereits 5 Stunden lang arbeiten, aber Nutzer lassen nur 42 Minuten zu
- Das zeigt, dass wir uns noch in einer frühen Phase der AI-Nutzung befinden
- und dass es noch viele Bereiche gibt, in denen noch nicht einmal 1 Minute Intelligenz angewendet wurde