18 Punkte von GN⁺ 2026-02-23 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Software Engineering macht rund 50 % aller Tool-Aufrufe von AI-Agenten aus, während 16 Verticals wie Healthcare, Recht und Finanzen jeweils auf unter 5 % kommen
  • Die tatsächlichen Fähigkeiten von AI-Modellen reichen inzwischen für Aufgaben, für die Menschen 5 Stunden brauchen würden, doch in der Praxis liegt die Session auf dem 99,9. Perzentil nur bei etwa 42 Minuten — zwischen Fähigkeit und Vertrauen besteht also eine große Lücke
  • Mit wachsender Nutzungserfahrung steigt die Auto-Approval-Rate von 20 % auf über 40 %, während erfahrene Nutzer ihre Aufsichtsstrategie zugleich von Vorabfreigaben auf aktives Monitoring umstellen
  • Der Kern von Vertical AI liegt in proprietärer Datenintegration, domänenspezifischem Context Engineering und Change Management beim Kunden; genau das trennt bloße Wrapper von verteidigungsfähigen Unternehmen
  • So wie SaaS in den vergangenen Jahrzehnten mehr als 170 Unicorns hervorgebracht hat, könnten zu jedem SaaS-Unicorn entsprechende Vertical-AI-Unicorns entstehen — und die AI-Version kann nicht nur Software, sondern auch Operatoren ersetzen

Software Engineering beansprucht die Hälfte der AI-Agenten-Aktivität

  • Laut einer von Anthropic veröffentlichten Studie zur realen Nutzung von AI-Agenten entfallen 49,7 % aller agentischen Tool-Aufrufe auf Software Engineering
  • Healthcare liegt bei 1 %, Recht bei 0,9 % und Bildung bei 1,8 %; unter den 16 Verticals kommt kein Bereich über 9 %
  • Das bedeutet nicht, dass der Markt gesättigt ist, sondern dass er noch gar nicht richtig geformt ist
  • Han Wang bezeichnet dies als eine Greenfield-Chance, die von den meisten Gründern übersehen werde
  • Der Autor dieses Beitrags, Garry Tan, sagt dazu: Wenn er jetzt gründen würde, würde er die rote Zone in dieser Grafik genau beobachten

Deployment Overhang

  • Laut der METR-Evaluierung können Claude-Modelle Aufgaben ausführen, für die Menschen 5 Stunden benötigen würden, doch reale Sessions dauern im Schnitt nur 42 Minuten
  • Die Lücke zwischen dem, was AI leisten kann, und dem, was Nutzer zulassen, schafft eine große Marktchance
  • Zwischen Oktober 2025 und Januar 2026 hat sich die Turn-Dauer im 99,9. Perzentil von unter 25 Minuten auf über 45 Minuten nahezu verdoppelt
    • Das ist nicht nur auf bessere Modellleistung zurückzuführen, sondern auch darauf, dass Nutzer pro Session Vertrauen aufbauen
  • Interne Daten zeigen, dass sich die Erfolgsrate von Claude Code verdoppelt hat, während menschliche Eingriffe pro Session von 5,4 auf 3,3 gesunken sind
  • Die Fähigkeiten des Modells sind ausreichend, aber das Deployment hält nicht Schritt — daraus ergeben sich neue Produktchancen

Wie sich Vertrauen entwickelt

  • Neue Nutzer genehmigen nur 20 % der Claude-Code-Sessions automatisch, aber nach 750 Sessions wechseln mehr als 40 % zur vollständigen Auto-Approval
  • Gegen die Intuition greifen erfahrene Nutzer nicht weniger, sondern häufiger ein — Eingriffsrate bei neuen Nutzern 5 %, bei erfahrenen 9 %
    • Das ist kein Widerspruch, sondern ein Wechsel der Oversight-Strategie: Anfänger genehmigen jeden Schritt vorab, erfahrene Nutzer delegieren und greifen erst bei Problemen ein (Vorabfreigabe → aktives Monitoring)
  • Eine sicherheitsrelevante Beobachtung: Bei komplexen Aufgaben stellt Claude Code mehr als doppelt so häufig Rückfragen, wie Menschen eingreifen
    • Der Agent läuft also nicht blind weiter, sondern stoppt selbst bei Unsicherheit
  • Die zentrale Lehre von Anthropic: Die tatsächlich ausgeübte Autonomie eines Agenten wird gemeinsam von Modell, Nutzer und Produkt konstruiert

Aaron Levies Vertical-AI-Playbook

  • Die von Aaron Levie skizzierte Formel zum Aufbau von Vertical AI:
    • Das Verständnis für einzigartige Daten, Workflows und regulatorische Hürden einer Branche ist der Kern verteidigungsfähiger Unternehmen
    • Es braucht mehr als einen simplen Wrapper: nötig sind Fähigkeiten für proprietäre Datenintegration, Workflow-Automatisierung und Change Management
    • Aufbau agentischer Software, die an proprietäre Daten angebunden ist
    • Software so gestalten, dass sie für reale Menschen und reale Probleme funktioniert
    • Die Intelligenz der Ausgaben durch domänenspezifisches Context Engineering maximieren
    • Was die meisten Gründer übersehen: Change Management für Kunden aktiv vorantreiben
  • Warum Vertical AI verteidigbar ist: Einen Wrapper kann jeder bauen, aber nur wenige können sich durch konkrete Workflows, regulatorische Einschränkungen und organisatorische Reibungen in Bereichen wie Healthcare-Abrechnung, Legal Discovery oder Baugenehmigungen navigieren
  • SaaS ist über Jahrzehnte hinweg pro Dekade um den Faktor 10 gewachsen; in den vergangenen 20 Jahren flossen mehr als 40 % des VC-Kapitals in SaaS, woraus mehr als 170 SaaS-Unicorns entstanden
  • Die Kernaussage: Zu jedem SaaS-Unicorn gibt es ein entsprechendes Vertical-AI-Unicorn, und die AI-Version könnte 10-mal größer werden, weil sie nicht nur Software, sondern auch Operatoren ersetzt

Erkenntnisse zur Co-Konstruktion und politische Implikationen

  • Die zentrale Erkenntnis von Anthropic:
    • Autonomie ist keine inhärente Eigenschaft des Modells, sondern wird gemeinsam von Modell, Nutzer und Produkt konstruiert
    • Voreinsatz-Evaluierungen allein erfassen das nicht; Messungen in realen Umgebungen sind daher unerlässlich
  • Sicherheitskennzahlen: Bei 73 % der Tool-Aufrufe greifen Menschen ein, und nur 0,8 % werden als irreversible Handlungen eingestuft
    • Die riskantesten Einsätze (API-Key-Leaks, autonomer Kryptohandel usw.) sind meist Security-Evaluierungen und nicht echte Produktionssysteme
  • Eine Politik des „Genehmige jede Handlung“ beeinträchtigt nur die Produktivität, ohne die Sicherheit zu verbessern;
    bessere politische Ziele bestehen darin sicherzustellen, dass Menschen überwachen und eingreifen können

Wo sich die Unicorns verstecken

  • Software Engineering ist bereits stark besetzt, während 16 Verticals mit einstelligen Marktanteilen — etwa Healthcare, Recht, Finanzen, Bildung, Customer Service und Logistik — noch darauf warten, dass jemand Domänenexpertise in Agenten einbaut
  • Früher sind 300 SaaS-Unicorns entstanden; als Nächstes werden 300 Vertical-AI-Unicorns auftauchen
  • Gründer, die ein Vertical auswählen, Domänenexpertise in Agenten einbauen und Change Management lösen, werden in den kommenden zehn Jahren die Enterprise-Software besitzen
  • Modelle können bereits 5 Stunden lang arbeiten, aber Nutzer lassen nur 42 Minuten zu
    • Das zeigt, dass wir uns noch in einer frühen Phase der AI-Nutzung befinden
    • und dass es noch viele Bereiche gibt, in denen noch nicht einmal 1 Minute Intelligenz angewendet wurde

Noch keine Kommentare.

Noch keine Kommentare.