35 Punkte von GN⁺ 2025-12-04 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Eine interne Umfrage unter 132 Ingenieur:innen und Forschenden bei Anthropic zeigt, dass KI-Zusammenarbeit rund um Claude die Arbeitsweise insgesamt verändert und zugleich Produktivität sowie Umfang der Arbeit erweitert.
  • Die Mitarbeitenden nutzen Claude in 59 % ihrer Arbeit und erleben im Schnitt eine Produktivitätssteigerung von 50 %; zugleich steigt die Menge der Ergebnisse deutlich, während sich die Nutzung ihrer Zeit neu ordnet.
  • Dank Claude bestehen 27 % aller durch Claude unterstützten Aufgaben aus Tätigkeiten, die sonst gar nicht gemacht worden wären; dazu zählen auch bisher aufgeschobene Arbeiten wie Prototyping, Dashboards, Tests und Dokumentation.
  • Gleichzeitig wachsen auch die Sorgen über nachlassende technische Fähigkeiten, weniger Mentorship und den Verlust des Handwerks des Codens; Menschen bewegen sich zunehmend in die Rolle von Manager:innen und Aufsichtspersonen für KI-Agenten.
  • Insgesamt macht KI Entwickler:innen zu „mehr Full-Stack und zu Menschen, die mehr Arbeit erledigen“, vergrößert aber zugleich Unsicherheit und Anpassungsdruck in Bezug auf langfristige Karrierepfade, Lernmethoden und Unternehmenskultur.

Überblick

  • Aufbauend auf früheren makroökonomischen Studien zu den Auswirkungen von KI auf den Arbeitsmarkt hat Anthropic diesmal eine interne Untersuchung unter den eigenen Ingenieur:innen und Forschenden durchgeführt, um zu verstehen, wie KI die tatsächliche Arbeit verändert.
    • Die Studie analysiert gemeinsam eine Umfrage unter 132 Ingenieur:innen und Forschenden vom Stand August 2025, 53 qualitative Interviews sowie Nutzungslogdaten von Claude Code.
    • Die Analyse zeigt, dass Entwickler:innen mehr Arbeit schaffen und vielfältigere Bereiche abdecken, dass damit aber auch die Sorgen über technische Tiefe, Zusammenarbeit und die berufliche Zukunft wachsen.
  • Anthropic-Ingenieur:innen übernehmen mit Claude Rollen, die stärker in Richtung Full Stack gehen, beschleunigen Lern- und Iterationszyklen und erledigen auch Aufgaben, die zuvor aufgeschoben wurden.
    • Gleichzeitig gibt es die Sorge, dass diese Ausweitung zu einem Verlust tiefgehender technischer Fähigkeiten und schwächerer Aufsichtskompetenz führen könnte.
  • Anthropic erkennt an, dass das Unternehmen sich in einem besonderen Umfeld mit besonders frühem Zugang zu den neuesten Tools befindet, betrachtet diese internen Veränderungen jedoch als Vorzeichen eines künftig breiteren gesellschaftlichen und industriellen Wandels, sodass frühe Beobachtungen sinnvoll seien.
    • Zum Zeitpunkt der Untersuchung waren Claude Sonnet 4 und Claude Opus 4 die leistungsstärksten Modelle; seitdem verbessert sich die Modellleistung weiter.
  • Insgesamt treten neben Produktivitätszuwachs und Ausweitung der Arbeit auch Herausforderungen wie der Erhalt technischer Fachlichkeit, die Bewahrung sinnvoller Zusammenarbeit und die Vorbereitung auf eine ungewisse Zukunft stärker hervor; intern laufen bei Anthropic bereits entsprechende Initiativen.
    • In einem separaten Beitrag werden auch wirtschaftspolitische Ideen rund um KI diskutiert; dieser Text konzentriert sich vor allem auf Veränderungen von Arbeit und Rollen innerhalb der Organisation.

Zentrale Erkenntnisse

  • Laut Umfragedaten nutzen Anthropic-Ingenieur:innen Claude vor allem für Debugging und Codeverständnis; sowohl der Nutzungsanteil als auch die wahrgenommene Produktivitätssteigerung haben sich innerhalb eines Jahres auf das 2- bis 3-Fache erhöht.
    • 27 % aller durch Claude unterstützten Aufgaben wären ursprünglich gar nicht angefallen und bestehen aus zusätzlicher Arbeit wie Projekterweiterungen, Dashboards und explorativen Experimenten.
    • Obwohl die meisten Mitarbeitenden Claude häufig nutzen, antworteten sie, dass der Anteil vollständig delegierbarer Aufgaben nur bei 0 bis 20 % liege; aktive Aufsicht und Verifizierung bleiben also essenziell.
  • In den Interviews wird sichtbar, wie Menschen Intuition für das Delegieren an KI aufbauen; ein gemeinsames Muster ist, zuerst Aufgaben zu delegieren, die leicht zu prüfen sowie risikoarm, langweilig oder repetitiv sind.
    • Einerseits erweitert Claude das technische Spektrum in Richtung Full-Stack-Fähigkeiten, andererseits gibt es die Sorge, dass durch weniger tiefgehende Praxis in Coding und Debugging grundlegende Fähigkeiten schwächer werden könnten.
    • Da Claude einen erheblichen Teil der Fragen ersetzt, die man früher Kolleg:innen gestellt hätte, äußern viele auch Bedenken über weniger Mentorship, weniger Gelegenheiten zum Lernen von Kolleg:innen und schwächere zwischenmenschliche Beziehungen.
  • In den Nutzungslogs von Claude Code werden steigende Aufgabenschwierigkeit, mehr aufeinanderfolgende Tool-Aufrufe und weniger menschliche Turns gleichzeitig beobachtet; das deutet darauf hin, dass zunehmend komplexere Aufgaben mit weniger Eingriffen übertragen werden.
    • Innerhalb von sechs Monaten ist der Anteil von Implementierung neuer Funktionen sowie Code-Design/Planung deutlich gestiegen; 8,6 % aller Aufgaben bestehen aus kleinen, lange aufgeschobenen Qualitätsverbesserungen wie „papercut fix“.
    • Je nach Team nutzen etwa Pre-training, Alignment & Safety, Security und Non-technical Teams Claude für Aufgaben außerhalb ihres jeweiligen Fachgebiets; insgesamt zeigt sich, dass alle ein Stück weit mehr in Richtung Full Stack gehen.
  • Im Abschnitt Looking forward formuliert Anthropic das Ziel, ein Experimentierlabor für Best Practices der Zusammenarbeit mit KI zu werden, und nennt nächste Schritte zur Neugestaltung von Kollaborationsformen, Unterstützung der Karriereentwicklung und Etablierung von Best Practices für den KI-Einsatz.
    • Die Forschung soll auf andere Berufsgruppen über Ingenieur:innen hinaus ausgeweitet werden; außerdem arbeitet Anthropic mit externen Bildungseinrichtungen wie CodePath zusammen, um CS-Curricula an das KI-Zeitalter anzupassen.

Umfragedaten

  • Wofür Claude verwendet wird

    • Auf Basis einer Umfrage unter 132 Ingenieur:innen und Forschenden wurde die Nutzung von Claude nach Häufigkeit in Kategorien wie Debugging, Codeverständnis, Refactoring, Data Science, Frontend und Design/Planung aufgeschlüsselt
      • 55 % der Befragten gaben an, Claude täglich zum Debugging zu verwenden, 42 % täglich zum Codeverständnis und 37 % täglich zur Implementierung neuer Funktionen
      • Dagegen wird erklärt, dass High-Level-Design, Planung, Data Science und Frontend-Entwicklung insgesamt seltener anfallen und Menschen diese Aufgaben eher selbst erledigen wollen, weshalb der Anteil der täglichen Nutzung niedriger ausfällt
    • Diese Verteilung stimmt auch weitgehend mit der später gezeigten Aufgabenverteilung in den tatsächlichen Nutzungslogs von Claude Code überein; Debugging, Codeverständnis und die Implementierung neuer Funktionen haben sich dabei als zentrale Nutzungsschwerpunkte etabliert
  • Nutzung und Produktivität

    • Mitarbeitende erinnerten sich daran, dass sie vor 12 Monaten Claude in 28 % ihrer Arbeit nutzten und dabei eine Produktivitätssteigerung von etwa 20 % wahrnahmen, während sie heute angeben, Claude in 59 % ihrer Arbeit zu nutzen und im Schnitt eine Produktivitätssteigerung von 50 % zu spüren
      • Das wird als eine Entwicklung bewertet, bei der sowohl Nutzungsanteil als auch Produktivitätsgewinn innerhalb eines Jahres um mehr als das Doppelte gestiegen sind
      • Intern wird zudem die Kennzahl genannt, dass die durchschnittliche Zahl gemergter PRs pro Ingenieur:in und Tag um 67 % gestiegen sei; dies stehe im Zusammenhang mit dem Zeitraum der unternehmensweiten Einführung von Claude Code
    • Die Auswertung der Umfrage zeigte eine Korrelation, nach der der selbst berichtete Produktivitätsgewinn mit der Nutzungsmenge von Claude zunimmt; 14 % der Befragten wurden als „Power User“ eingestuft, die eine Produktivitätssteigerung von 100 % oder mehr erlebt haben
      • Gleichzeitig weisen auch die Forschenden darauf hin, dass Produktivität sehr schwer zu messen ist und es Verzerrungen bei Selbstangaben sowie Grenzen bei der Kategorisierung von Arbeitsbereichen gibt
      • In externer Forschung von METR zeigte sich, dass Entwickler:innen dazu neigen, Produktivitätssteigerungen bei Nutzung von AI-Hilfe zu überschätzen; Anthropic erklärt, dass es im eigenen Fall Unterschiede geben könnte, weil Bereiche mit geringerem AI-Einsatz bewusst herausgefiltert wurden
    • Für die einzelnen Aufgabenkategorien, in denen Claude unterstützt, berichteten Mitarbeitende von einem Muster, bei dem die benötigte Zeit etwas sinkt, die Menge der Ergebnisse aber deutlich steigt
      • In den meisten Kategorien wie Debugging, Codeverständnis und Refactoring überwiegen zwar Antworten mit Zeitersparnis, zugleich gibt es aber auch recht viele Antworten mit „mehr Zeitaufwand“, was auf eine Polarisierung hindeutet
      • Als Gründe für gestiegenen Zeitaufwand nannten die Betroffenen vor allem die Last des Debuggings und Aufräumens von Claude-Code, zusätzliche kognitive Belastung, um von AI geschriebenen Code zu verstehen, sowie Situationen, in denen sie mehr explorieren und lernen
      • Die Studie weist als Einschränkung darauf hin, dass aus diesen Daten nicht klar hervorgeht, wohin die eingesparte Zeit umverteilt wird und ob dabei auch Aktivitäten außerhalb der eigentlichen Arbeit einbezogen sind, und betont den Bedarf an weiterer Forschung
  • Neue Arbeit, die Claude ermöglicht

    • Mitarbeitende antworteten, dass von den Claude-unterstützten Aufgaben, die sie ausführen, rund 27 % Aufgaben seien, die sie ursprünglich gar nicht erledigt hätten
      • Dazu zählen das Hochskalieren von Projekten, die Erstellung von nice-to-have-Tools wie interaktiven Daten-Dashboards, repetitive aber nützliche Arbeiten wie Dokumentation und Tests sowie explorative Experimente mit ungünstigem Kosten-Nutzen-Verhältnis
      • Auch Arbeiten zur Behebung kleiner Qualitätsmängel (Papercuts), Refactoring zur Verbesserung der Wartbarkeit sowie kleine Skripte und Tools zur schnelleren Unterstützung von Aufgaben fallen in diese Kategorie
    • Ein Forschender erklärte, er lasse mehrere Versionen von Claude gleichzeitig laufen, um unterschiedliche Ansätze parallel zu erkunden, und verglich das nicht mit einem einzelnen Hochleistungsmodell, sondern mit vielen gleichzeitig laufenden „Pferden“
      • Dank dieser parallelen Exploration habe sich die Breite der Ideensuche und die Zahl der Experimente gegenüber früher stark erhöht, was kreativere Ansätze ermögliche
  • Anteil vollständig delegierbarer Arbeit

    • Selbst unter Ingenieur:innen, die Claude häufig nutzen, machte die Antwort 0 bis 20 % bei der Frage nach dem Anteil der Arbeit, den sie als vollständig delegierbar empfinden, mehr als die Hälfte aus
      • Die Forschenden ergänzen, dass „vollständige Delegation“ von den Befragten sehr unterschiedlich verstanden worden sein könnte — von einem Niveau, das ohne Verifikation unbeaufsichtigt bleiben kann, bis hin zu einem Niveau, bei dem eine sehr leichte Prüfung ausreicht
    • Menschen erklärten insbesondere bei komplexen Aufgaben, Hochrisiko-Domänen und Bereichen mit hohen Anforderungen an die Codequalität, dass sie weiterhin aktiv mit Claude interagieren und die Ausgaben verifizieren
      • Insgesamt ist Claude damit eher ein stets anwesender Kollaborateur; der Anteil, der es als Automatisierungswerkzeug betrachtet, bei dem Menschen vollständig loslassen, ist bislang noch gering

Qualitative Interviews

  • Strategien zur Delegation an AI

    • Die an den Interviews beteiligten Ingenieur:innen und Forschenden beschrieben jeweils ausführlich ihre Kriterien und Strategien für die Delegation an Claude und erklärten übereinstimmend, dass sie vor allem die folgenden Bedingungen priorisieren
      • Wenn der Nutzerkontext gering, die Aufgabe aber einfach ist: So wurde etwa erklärt, dass die meisten Infrastrukturaufgaben keine schwierigen Probleme seien und Claude auch fehlende Git- oder Linux-Erfahrung gut ausgleichen könne
      • Aufgaben, die sich leicht verifizieren lassen: Sie seien besonders gut geeignet für „Arbeit, bei der die Kosten der Verifikation nicht höher sind als die Kosten der Erstellung“, weshalb bevorzugt Aufgaben delegiert würden, deren Ergebnisse sich schnell per Plausibilitätsprüfung kontrollieren lassen
      • Klar definierte Subkomponenten: In Projekten werden zunächst Aufgaben auf Ebene sauber abgegrenzter Untermodule oder Funktionen an Claude übergeben
      • Bereiche, in denen Codequalität nicht geschäftskritisch ist: Einmaliger Debug-Code, Forschungscode oder experimentelle Skripte werden zuerst an Claude gegeben, während wichtige Architekturentscheidungen, schwieriges Debugging und anspruchsvolles Design eher selbst gelöst werden
      • Wiederholende, langweilige und aufgeschobene Arbeit: Bei Aufgaben, die man ungern angegangen und deshalb aufgeschoben hat, senke schon der Einstieg über ein Gespräch mit Claude die Einstiegshürde deutlich
    • In der Umfrage gaben die Befragten an, dass im Schnitt 44 % der von Claude unterstützten Arbeit „Dinge waren, die sie selbst nicht gern gemacht hätten“; das zeigt auch eine Tendenz, unangenehme Aufgaben eher an AI abzugeben
    • Umgekehrt sagten einige auch, dass sie bei kleinen Aufgaben, die sich wohl in unter 10 Minuten erledigen lassen, Claude gar nicht erst einsetzen, und dass es wegen des „Cold-Start-Problems“, also dem Erklären des internen Kontexts der Codebasis an die AI, Fälle gibt, in denen es schneller ist, die Aufgabe direkt selbst zu erledigen
  • Vertrauensaufbau und Verifikation

    • Viele Ingenieur:innen erwähnten eine Phase des Vertrauensaufbaus, in der sie zunächst mit einfachen Fragen, sprachlicher Hilfe oder Basisfragen zu unbekannten Sprachen wie Rust beginnen und Claude dann schrittweise komplexere Aufgaben anvertrauen
      • Ein Ingenieur verglich diesen Vertrauensprozess mit veränderten Nutzungsgewohnheiten bei Google Maps: Anfangs nutze man es nur auf unbekannten Wegen, inzwischen sei man aber an einem Punkt, an dem man es sogar auf dem Arbeitsweg vollständig vertraut
    • Ob Claude außerhalb des eigenen Fachgebiets oder innerhalb des eigenen Fachgebiets eingesetzt wird, dazu gingen die Meinungen auseinander
      • Manche nutzen Claude in Bereichen, in denen sie schwächer sind, etwa Frontend, Infrastruktur oder Datenbanken, um die Implementierungszeit zu verkürzen
      • Andere vertreten die Ansicht, dass man ein Ergebnis nur bewerten kann, wenn man es selbst ausreichend versteht, und setzen Claude daher gerade in Bereichen ein, die sie gut kennen, um es wie einen Beschleuniger zu nutzen
    • Ein Security Engineer beschrieb einige von Claude vorgeschlagene Lösungen als „riskante, aber clevere Ideen, wie sie ein sehr fähiger Junior einbringen würde“, und betonte, dass man ausreichend Erfahrung und Urteilsvermögen braucht, um die Risiken zu erkennen
    • Einige Ingenieur:innen erklärten, dass sie Claude sowohl im Kern ihres Fachgebiets als auch in angrenzenden Bereichen einsetzen und die Art der Prompts sowie das Ausmaß der Verifikation je nach eigener Expertise fein abstimmen
      • In gut bekannten Bereichen geben sie Claude konkrete Schritte und Einschränkungen vor; in weniger vertrauten Bereichen lassen sie Claude die Rolle eines Experten übernehmen und mehrere Optionen sowie Abwägungen darlegen
  • Grenzen der Arbeit, die Menschen selbst übernehmen

    • Die Befragten erklärten übereinstimmend, dass sie übergeordnetes und strategisches Denken, Systemdesign sowie Entscheidungen, die organisatorischen Kontext und „Taste“ erfordern, weiterhin selbst übernehmen
      • Im Interview fiel etwa die Formulierung: „Normalerweise mache ich das große Ganze und das Design selbst, während ich die Implementierung neuer Features, Debugging und Ähnliches so weit wie möglich delegiere“
    • Auch in der Umfrage zeigte sich im Bereich Design und Planung der geringste Produktivitätszuwachs, was so interpretiert wird, dass Design selbst weiterhin als menschliche Aufgabe betrachtet wird
    • Allerdings wird diese Grenze nicht als fix, sondern als „moving target“ beschrieben; mit steigender Modellleistung verschiebt sich nach gemeinsamer Wahrnehmung der Zuständigkeitsbereich von AI allmählich nach oben
  • Veränderung und Erweiterung von Skills

    • Viele Ingenieur:innen erklärten, dass Claude ihnen ermögliche, Aufgaben außerhalb ihres eigentlichen Fachgebiets zu übernehmen
      • So wird die Anekdote geschildert, dass ein Backend Engineer in mehreren Dialogrunden mit Claude eine komplexe UI aufgebaut habe und Designer anschließend fragten: „Hast du das wirklich selbst gebaut?“
      • Mehrere Befragte sagten, dass sie sich dank Claude inzwischen viel eher an Frontend, transaktionale DBs, APIs und Experiment-Infrastruktur heranwagen und nun auch Bereiche anfassen, die ihnen früher „zu heikel zum Anfassen“ erschienen
    • Diese Erweiterung der Fähigkeiten beschleunigt auch Feedback-Loops und Lerngeschwindigkeit
      • Aufgaben, für die man früher Wochen brauchte, um eine Funktion zu bauen, Meetings anzusetzen, Feedback zu erhalten und erneut nachzubessern, könnten heute durch mehrstündige kollaborative Sessions in Echtzeit ersetzt werden
    • Mehrere Personen erwähnten, dass Claude die Geschwindigkeit beim Prototyping, die Fähigkeit zu paralleler Arbeit und das Ambitionsniveau von Projekten erhöht habe
      • Ein Senior Engineer urteilte, dass das Tool Junior Engineers produktiver macht und ihnen den Mut gibt, größere Projekte anzugehen
      • Ein anderer Engineer sagte, Claude habe die zum Arbeitsbeginn nötige „Aktivierungsenergie“ stark reduziert, sodass sich auch lange aufgeschobene Probleme leichter anpacken ließen
  • Sorgen über Skill-Verlust und das Aufsichtsparadox

    • Zugleich äußerten viele Befragte die Sorge, dass „mit wachsender Delegation die eigenen Fähigkeiten zurückgehen“, insbesondere weil incidental learning im Problemlösungsprozess abnehme
      • Wenn man schwierige Bugs selbst debuggt, liest man normalerweise breit in Dokumentation, umliegendem Code und relevanten Konfigurationen; wenn Claude einen jedoch sofort zum Kern führt, gibt es weniger Gelegenheiten, ein Gesamtmodell des Systems aufzubauen
      • Es gab auch die Aussage, dass man früher bei neuen Tools alle Konfigurationsoptionen durchgesehen und Funktionen praktisch selbst gelernt habe, während man heute oft nur noch dem von der AI vorgeschlagenen Weg folgt und dadurch das Gefühl hat, ein tiefes Verständnis zu verpassen
    • Ein Senior Engineer sagte, er mache sich weniger Sorgen, weil er die Grundlagen bereits ausreichend aufgebaut habe; stünde er aber noch am Anfang seiner Laufbahn, müsste er sich wohl deutlich bewusster darum bemühen, die eigenen Fähigkeiten weiterzuentwickeln
    • Ein besonders häufig genanntes Konzept war das „paradox of supervision“
      • Um Claude sicher einzusetzen, sei die Fähigkeit wichtig, AI-Ausgaben zu beaufsichtigen und zu verifizieren; je stärker man sich jedoch auf AI verlasse, desto eher könnten genau die für diese Aufsicht nötigen Coding- und Designfähigkeiten schwächer werden
      • Eine Person sagte, noch problematischer als bloßer Fähigkeitsverlust sei für sie die Sorge, dass die Aufsichtsfähigkeit sinkt und man AI dadurch nicht mehr sicher einsetzen kann
    • Um dem entgegenzuwirken, erwähnten einige Ingenieur:innen, dass sie bewusst „üben, Probleme ohne Claude zu lösen“
      • Obwohl sie wissen, dass Claude manche Probleme gut lösen könnte, bearbeiten sie einen Teil davon absichtlich selbst, um ihr Gespür zu erhalten
  • „Höhere Abstraktion“ und Software-Handwerk

    • In mehreren Interviews kam die Sichtweise auf, dass sich Software Engineering auf ein höheres Abstraktionsniveau verlagert
      • Von Zeiten, in denen man Speicher manuell verwaltete, Assembler schrieb oder Hardware-Schalter umlegte, habe sich die Entwicklung schrittweise zu Hochsprachen und Runtimes bewegt, die Low-Level-Details übernehmen; nun gehe es weiter zur Phase von „English as a programming language“, also dazu, Absichten in natürlicher Sprache zu beschreiben und Code erzeugen zu lassen
      • Jemand zog die Analogie zur in Informatikkursen traditionell wichtigen Implementierung verketteter Listen: Es sei weiterhin gut, sie selbst implementieren zu können, aber im realen Arbeitsalltag komme es kaum noch vor, dass man das wirklich direkt codiert
    • Einige sagten, Claude ermögliche es ihnen sogar, sich stärker auf High-Level-Konzepte, Muster und User Experience zu konzentrieren, und formulierten es so: Offenbar hätten sie gar nicht das Schreiben von Code selbst geliebt, sondern die Ergebnisse, die Code hervorbringt
    • Andere bedauerten, dass die Freude am Codieren selbst und das „handwerkliche“ Gefühl der Befriedigung abnehme
      • Eine Person mit 25 Jahren Programmiererfahrung sagte, der Stolz auf die eigene ausgefeilte Coding-Kompetenz sei immer ein zentraler Teil ihrer Arbeitszufriedenheit gewesen, und nun habe sie das Gefühl, dass dieser Aspekt verschwimme
      • Es fiel auch die Formulierung, dass den ganzen Tag nur Prompts einzugeben keinen Spaß mache und dabei die Freude am „Flow-Zustand“ des eigenen Codens bei Musik verloren gehe
  • Manche sagen: „Ich vermisse zwar den ‚Zen-Zustand‘, völlig im Refactoring zu versinken, aber die Steigerung der Gesamtproduktivität ist so viel größer, dass ich gerne darauf verzichte“ – und machen damit deutlich, dass sie zwischen der Freude am eigenen Handwerk und der Maximierung von Ergebnissen eine pragmatische Wahl treffen

    • Insgesamt zeigt sich, dass wie jemand KI-Unterstützung empfindet, stark davon abhängt, was diese Person an Software Engineering als besonders sinnstiftend erlebt
  • Veränderungen bei Zusammenarbeit und sozialen Beziehungen

    • Für viele ist Claude zur ersten Anlaufstelle geworden, noch bevor sie Kolleginnen oder Kollegen etwas fragen
      • Eine befragte Person erklärte, sie stelle insgesamt zwar mehr Fragen als früher, davon aber 80–90 % an Claude und nur die übrigen 10–20 % an Menschen
      • Dadurch entsteht ein Filtereffekt: Routinefragen werden von Claude abgefangen, während Fragen an Menschen sich auf strategische, kontextabhängige und besonders schwierige Probleme konzentrieren
    • Etwa die Hälfte hat dennoch das Gefühl, dass sich die Muster der Teamzusammenarbeit bislang nicht grundlegend verändert haben, und sagt, Meetings, Kontextweitergabe und Richtungsentscheidungen fänden weiterhin zwischen Menschen statt
      • Gleichzeitig gibt es die Erwartung, dass künftig Gespräche mit mehreren ‚Claude-Instanzen‘ anstelle konzentrierter Einzelarbeitszeit zur neuen Grundeinheit der Arbeit werden könnten
    • Andere spüren dagegen klar, dass die Interaktion mit Kolleginnen und Kollegen abgenommen hat
      • Es fällt die Formulierung: „In letzter Zeit arbeite ich wohl mehr mit Claude als mit meinen Kolleginnen und Kollegen.“ Positiv sei, dass das schlechte Gewissen abnehme, anderen Zeit wegzunehmen; gleichzeitig bedauern viele, dass die Freude an der Zusammenarbeit mit Menschen kleiner wird
      • Manche empfinden auch eine Teamkultur als unangenehm, in der automatisch die Gegenfrage kommt: ‚Hast du zuerst Claude gefragt?‘; andere sagen, sie bevorzugten weiterhin eine direktere Zusammenarbeit von Mensch zu Mensch
    • Besonders deutlich sind die Veränderungen beim Mentoring und bei der Ausbildung von Junior-Entwicklerinnen und -Entwicklern
      • Es wird beobachtet, dass Claude für Junioren oft die Rolle von detailliertem Coaching und Code Review übernimmt, wodurch sie deutlich seltener mit Fragen auf Seniors zugehen
      • Eine Senior-Person formulierte ihre gemischten Gefühle so: „Ich finde es schade, dass Junioren seltener mit Fragen zu mir kommen, aber es stimmt auch, dass sie schneller gute Antworten bekommen und dadurch schneller lernen.“
  • Karriereunsicherheit und Anpassung

    • Mehrere Personen beschreiben, dass sich ihre Rolle vom direkten Schreiben von Code hin zum Management von KI-Agenten und zur Code-Review verschiebt
      • Jemand beschreibt seine heutige Arbeit als „eine Rolle, die stellvertretend Verantwortung für die Arbeit von 1, 5 oder 100 Claudes trägt“, und sagt, er arbeite bereits den ganzen Tag mit mehreren Claude-Instanzen parallel
      • Eine andere Person schätzt, dass sich mehr als 70 % ihrer Arbeit in Richtung Code Review und Korrekturen verlagert haben
    • Bei den langfristigen Karriereaussichten mischten sich häufig kurzfristiger Optimismus und langfristige Unsicherheit
      • So fällt etwa die Aussage: „Kurzfristig bin ich ziemlich optimistisch, aber langfristig habe ich auch die Sorge, dass KI am Ende den Großteil übernehmen wird und ich und viele andere überflüssig werden könnten.“
      • Eine andere Person formuliert es noch direkter: Es fühle sich an, als käme sie jeden Tag zur Arbeit, um sich selbst zu automatisieren
    • Einige sorgen sich besonders um die Zukunft von Junior-Entwicklerinnen und -Entwicklern, sehen zugleich aber Hoffnung darin, dass gerade sie die Generation sind, die neue Technologien am schnellsten annimmt
      • Es gebe zwar das Risiko, dass Junioren fehlerhaften KI-generierten Code ungeprüft deployen, doch zugleich wird die Hoffnung geäußert, dass sich mit besseren Guardrails, besserem Lernmaterial und Lernen aus Fehlern über die Zeit eine Anpassung erreichen lässt
    • Zu Zukunftsstrategien und Anpassungsformen wurden verschiedene Antworten genannt
      • Der Plan, die Fähigkeit zur sinnvollen Review und Aufsicht von KI-Ergebnissen zur neuen Kernkompetenz zu machen
      • Die Erwartung, künftig mehr Zeit auf Konsensbildung, Abstimmung und Strategieentwicklung zwischen Menschen zu verwenden und die Implementierung stärker der KI zu überlassen
      • Es wird auch ein Beispiel genannt, bei dem jemand Claude nutzt, um Feedback zu Leadership, Kommunikation und Karriereentwicklung zu erhalten und so das eigene Lerntempo zu steigern
    • Insgesamt lässt sich die Stimmung so zusammenfassen: Das Vertrauen darin, welche Skills in Zukunft am wichtigsten sein werden, ist sehr gering, und gleichzeitig gilt die Haltung, dass entscheidend sei, zu Menschen und Organisationen zu werden, die sich schnell anpassen können – egal, was kommt

Nutzungstrends von Claude Code

  • Schwierigere Probleme und mehr Autonomie

    • Anthropic analysierte mithilfe interner Tools zum Schutz der Privatsphäre 200.000 interne Logeinträge von Claude Code aus zwei Zeitpunkten, Februar und August 2025
      • Bei der Bewertung jeder Konversation auf einer Schwierigkeitsskala von 1 bis 5 stieg die durchschnittliche Schwierigkeit von 3,2 auf 3,8
        • Beispiele für das Niveau 3,2 sind etwa „Behebung eines Python-Modul-Importfehlers“, für 3,8 etwa „Implementierung und Optimierung eines Caching-Systems“
    • Die durchschnittliche Zahl der Tool-Aufrufe, die Claude Code ohne menschliches Eingreifen fortlaufend ausführt, stieg von 9,8 auf 21,2 und damit um 116 %
      • Das bedeutet, dass Claude Dateiänderungen und Befehlsausführungen selbstständig über längere Sequenzen hinweg fortsetzt und so komplexe Aufgaben bearbeitet
    • Die Zahl der menschlichen Turns pro Konversation sank im Schnitt von 6,2 auf 4,1 um 33 %, was auf eine Tendenz zu weniger menschlicher Interaktion für dieselbe Aufgabe hindeutet
      • Zusammengenommen deuten diese Kennzahlen darauf hin, dass Ingenieurinnen und Ingenieure komplexere Aufgaben mit mehr Autonomie an Claude übertragen
  • Veränderungen in der Aufgabenverteilung

    • Jede Konversation in den Claude-Code-Logs wurde nach Kategorien wie Debugging, Codeverständnis, Refactoring, Tests, Implementierung neuer Funktionen, Code-Design/-Planung, Frontend und Data Science klassifiziert, um die Aufgabenverteilung zu vergleichen
      • Die Gesamtverteilung stimmt weitgehend mit den in der Umfrage berichteten typischen Nutzungsmustern (vor allem Debugging, Codeverständnis und Implementierung neuer Funktionen) überein
    • Die auffälligste Veränderung in sechs Monaten ist der starke Anstieg des Anteils von Implementierung neuer Funktionen sowie Code-Design/-Planung
      • Die Implementierung neuer Funktionen stieg in allen Logs von 14,3 % auf 36,9 %, Aufgaben rund um Design und Planung von 1,0 % auf 9,9 %
      • Laut der Beschreibung könnte das bedeuten, dass Claude häufiger für komplexere und kreativere Aufgaben eingesetzt wird oder dass Teams Claude Code aktiv in solche Workflows integrieren
      • Die Forschenden merken an, dass sich ein Anstieg des absoluten Arbeitsvolumens und Verschiebungen in der relativen Verteilung nur schwer klar voneinander trennen lassen, und benennen dies als Einschränkung
  • Papercut-Fixes

    • Im Einklang mit den Umfrageantworten, wonach Menschen mehr kleinere Qualitäts- und Komfortverbesserungen erledigen, wurden in den Claude-Code-Logs 8,6 % aller Aufgaben als „papercut fix“ klassifiziert
      • Dazu zählen die Erstellung von Performance-Visualisierungstools, Refactoring zur Verbesserung der Wartbarkeit sowie kleine Komfortfunktionen wie Terminal-Shortcuts oder Skripte
    • Diese Aufgaben sind für sich genommen klein, können aber kumuliert Produktivität und Developer Experience spürbar verbessern
      • Charakteristisch ist, dass Arbeiten, die früher aus Prioritätsgründen aufgeschoben wurden, dank Claude mit geringerem Aufwand nun natürlicher erledigt werden
  • Unterschiede zwischen Teams

    • Auf Basis der Claude-Code-Logs von August 2025 wurden die Konversationen jeweils mit einem dominanten Aufgabentyp getaggt; der Vergleich der teambezogenen Verteilung wird in Figure 5 gezeigt
      • Im Gesamtdurchschnitt („All Teams“) machen Implementierung neuer Funktionen, Debugging und Codeverständnis den größten Anteil aus und zeigen damit das grundlegende Nutzungsmuster von Claude
    • Die wichtigsten Merkmale der einzelnen Teams sind wie folgt
      • Das Pre-training-Team verwendet 54,6 % der Claude-Code-Nutzung für die Implementierung neuer Funktionen, wobei insbesondere die Durchführung zusätzlicher Experimente einen großen Anteil ausmacht
      • Das Alignment & Safety-Team und das Post-training-Team weisen mit 7,5 % bzw. 7,4 % einen hohen Frontend-Anteil auf und nutzen Claude vor allem für den Aufbau von UIs zur Datenvisualisierung
      • Beim Security-Team entfallen 48,9 % der Claude-Code-Nutzung auf Codeverständnis, oft zur Analyse und Einschätzung der sicherheitsrelevanten Implikationen unbekannten Codes
      • Auch nichttechnische Mitarbeitende nutzen Claude Code häufig; 51,5 % entfallen auf Debugging (Netzwerkprobleme, Git-Probleme usw.), 12,7 % auf Data-Science-Aufgaben – als Werkzeug zur Überbrückung technischer Wissenslücken
    • Insgesamt nutzen die Teams Claude zwar für ihre Kernaufgaben (Infrastruktur, Forschung, Sicherheit usw.), zugleich aber auch für Aufgaben außerhalb traditioneller Fachgrenzen, sodass die Daten zeigen, dass alle ein Stück weit mehr in Richtung Full-Stack arbeiten

Ausblick

  • Nächste Schritte innerhalb von Anthropic

    • Auf Basis der Veränderungen des vergangenen Jahres versteht sich Anthropic als eine Art „Labor“ für die verantwortungsvolle Gestaltung der durch Claude ausgelösten Transformation der Arbeit
      • Gemeinsam mit Ingenieurinnen und Ingenieuren, Forschenden und der Führungsebene habe man begonnen, Zusammenarbeitsweisen, Meeting- und Kommunikationsstrukturen sowie Rollenprofile nach Funktionen neu zu prüfen und neue Best Practices für AI-unterstützte Arbeit zu entwickeln
    • Ein besonderer Fokus liegt darauf, wie sich Kompetenzentwicklung, Mentoring sowie Beförderungs- und Wachstumspfade im AI-Zeitalter verändern müssen; dabei wird auch das von Anthropic bereits veröffentlichte AI fluency framework herangezogen
      • Auf Grundlage eines Frameworks, das definiert, welches Maß an Verständnis, Aufsicht und Feedback-Fähigkeit Menschen bei der Zusammenarbeit mit AI haben sollten, sollen konkrete Schulungen und interne Richtlinien entworfen werden
    • Diese Studie ist zwar auf Ingenieurinnen und Ingenieure fokussiert, doch künftig wolle man den Umfang auch auf nichtentwickelnde Berufsgruppen ausweiten, um zu untersuchen, wie AI die Arbeit bei Anthropic insgesamt verändert
  • Externe Partnerschaften, Ausbildung und langfristige Planung

    • Neben der internen Forschung übernimmt Anthropic auch die Rolle, externe Organisationen bei der Anpassung an das Zeitalter AI-unterstützter Arbeit zu unterstützen
      • So wird etwa in Zusammenarbeit mit CodePath eine Neugestaltung des Informatik-Curriculums für eine AI-unterstützte Umgebung unterstützt
      • Darin spiegelt sich die Einsicht wider, dass die Ausbildung von Junior-Entwickelnden und Lernpfade für Berufseinsteigerinnen und -einsteiger unter der Annahme der Nutzung von AI-Tools neu entworfen werden müssen
    • Künftig könnten strukturelle Ansätze wie die Neugestaltung von Rollen innerhalb von Organisationen, Reskilling-Pfade und neue Wege für Jobwechsel immer wichtiger werden
      • Diskutiert werden könnte beispielsweise, neue Rollen wie die Aufsicht über AI-Agenten, Qualitätsverantwortung oder ethische Prüfung als offizielle Stellenprofile anzuerkennen
    • Anthropic kündigt an, 2026 konkretere Pläne zu veröffentlichen, und positioniert diese Studie als Ausgangspunkt und Zwischenbilanz
      • Die Kernbotschaft lautet, dass Anthropic den Wandel der Arbeit durch AI nicht nur beobachten, sondern selbst frühzeitig experimentieren und nachjustieren will, um ein Modell für einen „verantwortungsvollen Übergang“ zu schaffen

Noch keine Kommentare.

Noch keine Kommentare.