Wie autonom arbeiten AI-Agenten tatsächlich?
- Anthropic hat Hunderte Millionen Claude-Code-Interaktionen analysiert, um zu messen, wie viel Arbeit AI-Agenten tatsächlich übernehmen.
- Im Zentrum der Studie stand nicht die Modellleistung, sondern wie viel Autonomie Menschen tatsächlich delegiert haben.
- Die meisten Aufgaben sind kurz, aber die längste autonome Arbeitszeit stieg innerhalb von drei Monaten von 25 Minuten auf über 45 Minuten.
- Interessant ist, dass diese Veränderung nicht durch Modell-Upgrades, sondern durch den Aufbau von Nutzervertrauen entstand.
- Erfahrene Nutzer erhöhen den Anteil automatischer Freigaben und wechseln ihre Aufsichtsstrategie zugleich zu einer „Monitoring-Methode“ mit gezielten Eingriffen bei Bedarf.
- Außerdem zeigen auch AIs selbst Mechanismen der Selbstkontrolle, indem sie bei Unsicherheit nachfragen oder anhalten.
- Derzeit konzentriert sich die Hälfte der Agenten-Nutzung auf den Bereich der Softwareentwicklung.
- Letztlich wird die Autonomie von AI-Agenten nicht von der Modellleistung, sondern von Vertrauen, Organisationskultur und der Struktur der Tools bestimmt.
1 Kommentare
Kurz!<ctrl+ enter>