- Software Engineering macht rund 50 % aller Tool-Aufrufe von AI-Agenten aus, während 16 Verticals wie Healthcare, Recht und Finanzen jeweils auf unter 5 % kommen
- Die tatsächlichen Fähigkeiten von AI-Modellen reichen inzwischen für Aufgaben, für die Menschen 5 Stunden brauchen würden, doch in der Praxis liegt die Session auf dem 99,9. Perzentil nur bei etwa 42 Minuten — zwischen Fähigkeit und Vertrauen besteht also eine große Lücke
- Mit wachsender Nutzungserfahrung steigt die Auto-Approval-Rate von 20 % auf über 40 %, während erfahrene Nutzer ihre Aufsichtsstrategie zugleich von Vorabfreigaben auf aktives Monitoring umstellen
- Der Kern von Vertical AI liegt in proprietärer Datenintegration, domänenspezifischem Context Engineering und Change Management beim Kunden; genau das trennt bloße Wrapper von verteidigungsfähigen Unternehmen
- So wie SaaS in den vergangenen Jahrzehnten mehr als 170 Unicorns hervorgebracht hat, könnten zu jedem SaaS-Unicorn entsprechende Vertical-AI-Unicorns entstehen — und die AI-Version kann nicht nur Software, sondern auch Operatoren ersetzen
Software Engineering beansprucht die Hälfte der AI-Agenten-Aktivität
- Laut einer von Anthropic veröffentlichten Studie zur realen Nutzung von AI-Agenten entfallen 49,7 % aller agentischen Tool-Aufrufe auf Software Engineering
- Healthcare liegt bei 1 %, Recht bei 0,9 % und Bildung bei 1,8 %; unter den 16 Verticals kommt kein Bereich über 9 %
- Das bedeutet nicht, dass der Markt gesättigt ist, sondern dass er noch gar nicht richtig geformt ist
- Han Wang bezeichnet dies als eine Greenfield-Chance, die von den meisten Gründern übersehen werde
- Der Autor dieses Beitrags, Garry Tan, sagt dazu: Wenn er jetzt gründen würde, würde er die rote Zone in dieser Grafik genau beobachten
Deployment Overhang
- Laut der METR-Evaluierung können Claude-Modelle Aufgaben ausführen, für die Menschen 5 Stunden benötigen würden, doch reale Sessions dauern im Schnitt nur 42 Minuten
- Die Lücke zwischen dem, was AI leisten kann, und dem, was Nutzer zulassen, schafft eine große Marktchance
- Zwischen Oktober 2025 und Januar 2026 hat sich die Turn-Dauer im 99,9. Perzentil von unter 25 Minuten auf über 45 Minuten nahezu verdoppelt
- Das ist nicht nur auf bessere Modellleistung zurückzuführen, sondern auch darauf, dass Nutzer pro Session Vertrauen aufbauen
- Interne Daten zeigen, dass sich die Erfolgsrate von Claude Code verdoppelt hat, während menschliche Eingriffe pro Session von 5,4 auf 3,3 gesunken sind
- Die Fähigkeiten des Modells sind ausreichend, aber das Deployment hält nicht Schritt — daraus ergeben sich neue Produktchancen
Wie sich Vertrauen entwickelt
- Neue Nutzer genehmigen nur 20 % der Claude-Code-Sessions automatisch, aber nach 750 Sessions wechseln mehr als 40 % zur vollständigen Auto-Approval
- Gegen die Intuition greifen erfahrene Nutzer nicht weniger, sondern häufiger ein — Eingriffsrate bei neuen Nutzern 5 %, bei erfahrenen 9 %
- Das ist kein Widerspruch, sondern ein Wechsel der Oversight-Strategie: Anfänger genehmigen jeden Schritt vorab, erfahrene Nutzer delegieren und greifen erst bei Problemen ein (Vorabfreigabe → aktives Monitoring)
- Eine sicherheitsrelevante Beobachtung: Bei komplexen Aufgaben stellt Claude Code mehr als doppelt so häufig Rückfragen, wie Menschen eingreifen
- Der Agent läuft also nicht blind weiter, sondern stoppt selbst bei Unsicherheit
- Die zentrale Lehre von Anthropic: Die tatsächlich ausgeübte Autonomie eines Agenten wird gemeinsam von Modell, Nutzer und Produkt konstruiert
Aaron Levies Vertical-AI-Playbook
- Die von Aaron Levie skizzierte Formel zum Aufbau von Vertical AI:
- Das Verständnis für einzigartige Daten, Workflows und regulatorische Hürden einer Branche ist der Kern verteidigungsfähiger Unternehmen
- Es braucht mehr als einen simplen Wrapper: nötig sind Fähigkeiten für proprietäre Datenintegration, Workflow-Automatisierung und Change Management
- Aufbau agentischer Software, die an proprietäre Daten angebunden ist
- Software so gestalten, dass sie für reale Menschen und reale Probleme funktioniert
- Die Intelligenz der Ausgaben durch domänenspezifisches Context Engineering maximieren
- Was die meisten Gründer übersehen: Change Management für Kunden aktiv vorantreiben
- Warum Vertical AI verteidigbar ist: Einen Wrapper kann jeder bauen, aber nur wenige können sich durch konkrete Workflows, regulatorische Einschränkungen und organisatorische Reibungen in Bereichen wie Healthcare-Abrechnung, Legal Discovery oder Baugenehmigungen navigieren
- SaaS ist über Jahrzehnte hinweg pro Dekade um den Faktor 10 gewachsen; in den vergangenen 20 Jahren flossen mehr als 40 % des VC-Kapitals in SaaS, woraus mehr als 170 SaaS-Unicorns entstanden
- Die Kernaussage: Zu jedem SaaS-Unicorn gibt es ein entsprechendes Vertical-AI-Unicorn, und die AI-Version könnte 10-mal größer werden, weil sie nicht nur Software, sondern auch Operatoren ersetzt
Erkenntnisse zur Co-Konstruktion und politische Implikationen
- Die zentrale Erkenntnis von Anthropic:
- Autonomie ist keine inhärente Eigenschaft des Modells, sondern wird gemeinsam von Modell, Nutzer und Produkt konstruiert
- Voreinsatz-Evaluierungen allein erfassen das nicht; Messungen in realen Umgebungen sind daher unerlässlich
- Sicherheitskennzahlen: Bei 73 % der Tool-Aufrufe greifen Menschen ein, und nur 0,8 % werden als irreversible Handlungen eingestuft
- Die riskantesten Einsätze (API-Key-Leaks, autonomer Kryptohandel usw.) sind meist Security-Evaluierungen und nicht echte Produktionssysteme
- Eine Politik des „Genehmige jede Handlung“ beeinträchtigt nur die Produktivität, ohne die Sicherheit zu verbessern;
bessere politische Ziele bestehen darin sicherzustellen, dass Menschen überwachen und eingreifen können
Wo sich die Unicorns verstecken
- Software Engineering ist bereits stark besetzt, während 16 Verticals mit einstelligen Marktanteilen — etwa Healthcare, Recht, Finanzen, Bildung, Customer Service und Logistik — noch darauf warten, dass jemand Domänenexpertise in Agenten einbaut
- Früher sind 300 SaaS-Unicorns entstanden; als Nächstes werden 300 Vertical-AI-Unicorns auftauchen
- Gründer, die ein Vertical auswählen, Domänenexpertise in Agenten einbauen und Change Management lösen, werden in den kommenden zehn Jahren die Enterprise-Software besitzen
- Modelle können bereits 5 Stunden lang arbeiten, aber Nutzer lassen nur 42 Minuten zu
- Das zeigt, dass wir uns noch in einer frühen Phase der AI-Nutzung befinden
- und dass es noch viele Bereiche gibt, in denen noch nicht einmal 1 Minute Intelligenz angewendet wurde
Noch keine Kommentare.