7 Punkte von GN⁺ 5 시간 전 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Das agentische Coding-Tool Claude Code verändert weniger das reine Schreiben von Code als vielmehr den Bau von Produkten und die Neugestaltung von Workflows
  • In einer Microsoft-Umfrage unter Nutzern von KI bei der Arbeit zeigten sich gleichzeitig Druck zur schnellen KI-Einführung, die Entstehung neuer Arbeitsergebnisse und mehr Zeit für höherwertige Aufgaben, doch die Belohnung für KI-Experimente blieb gering
  • Wenn Organisationen bloß die Nutzung zum Ziel machen, entstehen Token-Leaderboards und aufgeblähte Nutzung; wichtiger sind Kennzahlen, die mit dem Mehrwert durch KI verknüpft sind
  • Boris Cherny meint, dass sich die Ingenieursrolle eher in Richtung Builder verschieben könnte, Nicht-Ingenieure ebenfalls Code erzeugen und Ingenieure sich weniger auf direktes Tippen als auf Urteilsvermögen, Planung und Nutzerverständnis konzentrieren werden
  • Mehr Produktivität durch KI führt nicht automatisch nur zu weniger Arbeitszeit oder weniger Jobs; Unternehmen werden Workflows KI-zentriert neu aufbauen, und Einzelne erhalten größere Wahlmöglichkeiten und mehr Hebelwirkung

Fallstricke bei KI-Arbeitsdaten und Organisationsmetriken

  • Microsoft hat 20.000 Nutzer untersucht, die KI in realer Arbeit einsetzen, und dabei ein Phänomen festgestellt, das als „transformation paradox“ bezeichnet wird
    • 65 % sorgen sich, ins Hintertreffen zu geraten, wenn sie KI nicht schnell übernehmen
    • 58 % erstellen mit KI Arbeitsergebnisse, die sie vor einem Jahr noch nicht hätten erstellen können
    • 66 % gaben an, dank KI mehr Zeit für höherwertige Arbeit zu haben
    • Gleichzeitig sagten nur 13 %, dass sie am Arbeitsplatz für KI-Experimente belohnt würden; zwischen Nutzungswillen und Organisation besteht also eine Lücke
  • In einer separaten Microsoft-Studie stieg die Nutzung um 17 %, wenn Führungskräfte den KI-Einsatz selbst vorlebten, und das Vertrauen in Agenten stieg um 30 %
    • Mehr als Slogans wie „KI ist die Zukunft“ wirkt es, wenn Führungskräfte konkret zeigen, wie sie sie tatsächlich einsetzen
    • Wenn Mitarbeitende glauben, an den Produktivitätsgewinnen durch KI teilhaben zu können, kann sich ihre Nutzungsbereitschaft ändern; finanziell vergütet wird das jedoch fast nirgends
  • Manche Arbeitsplätze bezuschussen Token-Kosten, aber diese Unterstützung führt nicht immer zu guten Ergebnissen

Token Maxing — Nebenwirkungen von Nutzungsmetriken

  • In großen Tech-Unternehmen tritt Token Maxing auf, also übermäßiger Token-Verbrauch, um die Nutzung künstlich zu erhöhen
    • Laut Amazon-Mitarbeitenden gegenüber der Financial Times führte Amazon ein von OpenClaw inspiriertes internes Tool namens mesh claw ein und förderte dessen Nutzung
    • Es gab teaminterne Rankings zum Token-Verbrauch, und einige Mitarbeitende ließen unproduktive Agenten sinnlos laufen, um ihre Zahlen zu steigern
    • Bei Meta lag der Spitzenverbrauch im Bereich von Hunderten Milliarden Tokens; ein Betrag im Wert von Millionen Dollar wurde faktisch verschwendet
  • Amazons offizielle Position lautet, dass Token-Nutzung kein Bewertungsmaßstab für Führungskräfte sei, doch Mitarbeitende gehen davon aus, dass Manager darauf schauen, und treiben daher die Roh-Nutzung hoch
    • Bei Amazon gibt es das Ziel von oben, dass 80 % der Entwickler wöchentlich KI nutzen sollen
    • Ohne konkrete Anreize bleibt nur das Motto „Nutzt KI“, während der eigentliche Zweck „Macht eure Arbeit besser“ verloren geht
    • Entwickler brauchen statt vager Tracking-Methoden klar an Wertschöpfung geknüpfte produktive Metriken

Die Entstehung von Claude Code und seine schnelle Verbreitung

  • Claude Code ist ein agentisches Coding-Tool, das Anthropic im Mai des Vorjahres veröffentlichte — ein Tool, das Code aus Worten erzeugt
    • Innerhalb von 8 Monaten nach dem Start war es für etwa 4 % des gesamten auf GitHub hochgeladenen Codes verantwortlich
    • Im Februar desselben Jahres erreichte es eine hochgerechnete Jahresumsatzrate von 2,5 Milliarden Dollar und wurde damit zum schnellsten Enterprise-Produkt auf diesem Niveau
    • Sein Erfinder Boris Cherny studierte Wirtschaft ohne Informatikabschluss, brach das Studium mit 18 ab, gründete ein Startup, arbeitete später bei einem Hedgefonds und anschließend 5 Jahre als Staff Engineer bei Meta, bevor er Ende 2024 wechselte
    • Heute schreibt Cherny selbst keine einzige Zeile Code mehr und betreibt 5 Agenten parallel in 5 Terminal-Tabs, um pro Tag 20 bis 30 Pull Requests zu bearbeiten
  • Das Projekt begann nicht als offizieller Auftrag, ein Coding-Tool zu bauen, sondern als Side Project, um sich mit APIs vertraut zu machen
    • Anfangs war es eine einfache Verbindung von Claude mit AppleScript, um die gerade laufende Musik anzuzeigen
    • Innerhalb von zwei Monaten entstand eine Version von Claude Code, und am ersten Tag nutzten es 20 % des Anthropic-Engineering-Teams
  • Cherny kam im September 2024 zu einem sehr kleinen Labs-Team
    • Dieses Team baute Claude Code, MCP, Skills und die Desktop-App; viele Ideen waren experimentell, und es war unklar, ob sie erfolgreich würden
    • Anthropic hatte sich auf Enterprise, Coding und Sicherheit fokussiert; wenn man also ein Produkt baut, erschien ein Coding-Produkt sinnvoll, das sowohl bessere Coding-Modelle als auch Sicherheitsforschung unterstützen würde
  • Die meisten Coding-Produkte damals waren IDE-Erweiterungen und auf dem Niveau von Sonnet 3.5 eher fortgeschrittene Autovervollständigung
    • Man spürte einen Model Overhang: Die Modelle konnten mehr, aber es gab kein Produkt, das diese Fähigkeiten richtig freisetzte; dieses Gefühl besteht bis heute
    • Die billigste Form war ein Tool, das ohne separates UI oder App direkt im Terminal läuft, und genau das wurde in wenigen Tagen gebaut
    • Die Nutzung verbreitete sich zunächst im Umfeld und erreichte innerhalb weniger Wochen viele Mitarbeitende; innerhalb von 5 Tagen nutzte die Hälfte des Engineering-Teams das Tool
    • Selbst Ingenieure, die das Terminal mieden, griffen dazu, und Cherny konzentrierte sich statt auf Analysen darüber, ob „Software Engineering sich für immer verändert hat“, einfach auf den Launch

Verschwinden Ingenieure? — Die Vermischung von Rollen

  • Der erste Schockmoment war, als Claude die gerade laufende Musik identifizieren konnte
    • Auf eine Frage schrieb Claude AppleScript-Code, der den Musikplayer öffnete; Cherny kannte die Sprache nicht und wäre selbst nie auf diese Art von Antwort gekommen
    • Das Problem wurde auf eine Weise gelöst, die ein Ingenieur so nicht gewählt hätte
  • Die Modelle entwickeln sich extrem schnell weiter, deshalb muss ein Produkt auf einem Modell jeden Monat neu justiert werden
    • Mit Co-work wurden 8 Flüge und 5 Hotels gebucht; der einzige Fehler war ein Hotel für etwa 5.000 Dollar pro Nacht, also über Budget — nur dieser Fall musste neu gebucht werden
  • Der Trend verläuft exponentiell, daher weiß es niemand genau, und zwei Dinge passieren gleichzeitig
    • Unternehmen, die durch höhere Produktivität von Ingenieuren für die gleiche Arbeit weniger Ingenieure benötigen
    • Unternehmen, die dank höherer Produktivität pro Kopf mehr Produkte und Geschäftsbereiche angehen und deshalb mehr Ingenieure brauchen (Chernys Team wird weiterhin durch Mangel an guten Ingenieuren gebremst und stellt so schnell wie möglich ein)
  • Die Rollen vermischen sich auf interessante Weise
    • Managerin Fiona hatte 15 Jahre lang nicht programmiert, codet seit ihrem Einstieg aber wieder; auch Produktmanagerin Cat und Designerin Megan programmieren — eigentlich das gesamte Team
    • Nicht-Ingenieure schreiben etwas mehr Code, während Ingenieure wie Cherny seit über 6 Monaten keinen Code mehr direkt schreiben und dennoch den ganzen Tag Dinge bauen
    • Ob man das künftig Builder, Engineer oder Product Manager nennt, ist unklar, aber die Rolle selbst verändert sich eindeutig

Die Traktor-Analogie — Wie lange technologische Verbreitung dauert

  • Der Traktor wurde in den 1890er Jahren in Iowa von John Frick erfunden, doch erst in den 1960er Jahren gab es in den USA mehr Traktoren als Pferde — das dauerte rund 70 Jahre
    • Traktoren steigerten Ertrag und Produktivität massiv, erforderten aber Training, und anfangs waren Pferde günstiger
    • Auch die Leistung war begrenzt: Für Weizen tauglich, für Mais nicht, und die Anpassung an verschiedene Nutzpflanzen dauerte lange
    • Bei der heutigen KI-Transformation passieren dieselben Probleme als Speedrun
  • Das passt zur Perspektive AI as normal technology: Auch wenn sehr leistungsfähige Modelle erscheinen, verändern sich Menschen und Organisationen langsam
    • Zugleich deuten die Umsatzkurven von Anthropic darauf hin, dass es dieses Mal schneller gehen könnte; man befindet sich noch in der Phase, die tatsächliche Veränderungsgeschwindigkeit abzuschätzen
  • Computer erhöhen die Produktivität, aber das bedeutet nicht automatisch weniger Arbeitszeit — man erledigt in derselben Zeit mehr

Ist Coding „gelöst“?

  • „coding is solved“ ist eine Aussage, die nur für die Art von Coding gilt, die ich mache
    • Chernys Produkte wie Cloud-CLI, Desktop-App und Mobile-App basieren auf relativ neuen und einfachen Codebasen
    • Bei großen und komplexen Codebasen großer Kunden wie NASA ist das noch nicht gelöst, und Modelle machen weiterhin Fehler
  • Die Gegenargumente von Ingenieuren — Coding sei nicht Tippen, sondern Urteilsvermögen, Gespür und kritisches Denken, und genau dort seien Agenten schwach — sind berechtigt
    • Schon früher bestand Chernys Tag nur zu etwa 50 % aus tatsächlichem Tippen von Code; der Rest waren Nutzergespräche, Brainstorming, Debugging, Design und Planung
    • Wenn Modelle das Coding übernehmen, werden Ingenieure frei für angenehmere Arbeit wie Gespräche mit Nutzern und die Planung des Nächsten
  • Claude Code wird seit über 6 Monaten zu 100 % mit Claude Code geschrieben, und andere Produkte wie Co-work ebenso
    • In einer Gesprächsrunde mit dem neuesten Y-Combinator-Batch hob bei der Aussage „100 % meines Codes wird mit Claude Code geschrieben“ etwa die Hälfte von Hunderten Teilnehmenden die Hand; bei „Ich schreibe überhaupt nicht mit Modellen“ genau eine Person, der Rest lag zwischen 50 und 100 %
    • Veränderungen im Engineering gelten als Frühindikator für Veränderungen in allen anderen Bereichen
  • Sorge vor Kompetenzverlust und der Wandel des Programmierens

    • Es gibt die Sorge, dass ohne direktes Schreiben von Code das Verständnis für den eigenen Beruf verkümmern könnte
      • Die Ingenieurin Lena im Team schreibt am Wochenende aus Freude weiter C++ von Hand; dafür wird es immer Raum geben
      • Cherny sieht das nicht als Verfall, sondern als Fortsetzung einer ständigen Evolution des Programmierens
        • In der Sowjetzeit galten Lochkarten als Programmierung, zur Zeit des Apollo-Programms auch handschriftliche Berechnungen auf Papier
        • Danach ging es von Maschinensprache zu Assembler und weiter zu JavaScript und Python; jetzt folgt der Schritt hin zu Gesprächen mit Agenten, und bald womöglich zu Agenten, die mit Agenten sprechen und so programmieren
      • Das sei ähnlich wie bei Taschenrechnern: Selbst wenn dadurch ein Teil der Rechenfertigkeit verkümmert, nutzt man sie weiter; anders ist nur die Frage, ob ein superintelligentes Werkzeug den Nutzer verdeckt schwächt
  • Kontroverse um Rückschritte bei der Modellleistung

    • Nach neuen Modell-Releases kommt regelmäßig der Vorwurf, die Leistung sei „stark zurückgegangen“
      • Tatsächlich gab es 2 Fälle, die auf echte Bugs zurückzuführen waren; Anthropic veröffentlichte Ursachen und Fixes im Blog
      • In den meisten anderen Fällen könnte es sich um einen Honeymoon-Effekt handeln: Man gewöhnt sich an das Modell, und das anfängliche Staunen nimmt ab
    • Anders als vor einem Jahr ist der von Modellen erzeugte Code heute besser als der Code, den Cherny selbst schreiben würde
      • Früher musste er jede Zeile dreimal prüfen; heute lässt er Claude arbeiten, das Ergebnis erneut prüfen und testen und führt gleichzeitig 15 Claude-Instanzen parallel aus

Das Produktivitätsparadox und größere Wahlmöglichkeiten

  • Dass Produktivität steigt, ohne dass die Arbeitszeit sinkt, hängt stark von individuellen Entscheidungen und der Situation des Unternehmens ab
  • Erklärt wird das mit einer Waschmaschinen-Anekdote
    • Vor der Waschmaschine dauerte ein Waschgang 5 bis 6 Stunden und erforderte etwa 3.000 ft Fußweg; Feuer machen, Wasser kochen, am Waschbrett schrubben und auswringen musste für jede Person in der Familie täglich wiederholt werden
    • Die Waschmaschine sparte pro Waschgang etwa 3 Stunden
    • Sie war einer der Faktoren, die den massiven Eintritt von Frauen in den Arbeitsmarkt ermöglichten
    • Die gewonnene Zeit schuf individuelle Wahlmöglichkeiten: mehr Zeit mit Kindern, Spaziergänge, Lesen, Freunde treffen oder der Einstieg in Fabrik- und Büroarbeit — KI erweitert Wahlmöglichkeiten auf ähnliche Weise
  • Rat an eine 22-jährige Person direkt nach dem CS-Abschluss: Es gibt weiterhin Junior-Stellen, aber wer auch nur etwas unternehmerisch denkt, sollte ein Startup gründen
    • Historisch gesehen ist es ein goldenes Zeitalter für Gründungen; „du und deine Agenten“ könnt ein riesiges Unternehmen aufbauen
    • Tatsächlich bauen heute 1 bis 3 Personen Unternehmen im Milliardenbereich und herausragende Startups auf, und die Hebelwirkung pro Person ist enorm
  • In 3 Jahren wird man sie vielleicht nicht mehr „Ingenieure“ nennen, aber die Zahl der Menschen, die Code schreiben oder mit Agenten erzeugen, wird 100-mal so groß sein wie heute

Claude Co-work — Ausweitung auf Nicht-Ingenieure

  • Co-work entstand, als man sah, dass Leute Claude Code im Terminal installierten, um etwa ihre Steuererklärung zu machen — also für Dinge jenseits des Codings
    • Es wurde nicht nur für Buchhaltung, Finanzen und Recht genutzt, sondern auch für Flugbuchungen, Konzerttickets oder sogar den Kauf einer Muschelsammelgenehmigung im Bundesstaat Washington
    • Coding-Produkte waren oft von Ingenieuren für sich selbst gebaut und dann auch für andere nützlich; Co-work ist eine neue Herausforderung, weil es für Nicht-Ingenieure im Allgemeinen gebaut wird
  • Eine Kernrichtung ist die Fähigkeit zu lang laufender Ausführung
    • Vor etwa anderthalb Jahren driftete Claude Code wegen der Modellgrenzen schon nach 30 Sekunden ab und brauchte Eingriffe
    • Heute laufen jede Nacht Hunderte bis Tausende Agenten 5, 10 oder 20 Stunden lang; so sieht Engineering derzeit aus
    • Co-work wird in dieselbe Richtung gehen, aber noch ist unklar, welche Aufgaben eine derart lange Laufzeit tatsächlich benötigen
  • Wenn Speicher und Nutzerverständnis besser werden, entwickelt sich das System in Richtung vorausschauender Bedürfnis-Erkennung
    • Beispiel: Es erkennt verbleibende Podcast-Folgen und noch nicht angefragte Gäste, brainstormt Kandidaten und legt erste Kontaktmails im Entwürfe-Ordner ab
    • Arbeit lässt sich entweder horizontal definieren, etwa als „gesamtes Design“, oder vertikal als vollständige Durchführung eines konkreten Ziels
    • Ein vertikales Beispiel: Claude baut eine Funktion, testet sie, merged sie und bringt sie live
  • Seit Opus 4.7 ist Claude proaktiver
    • Nach einem Feature-Release plant es selbst eine Erinnerung, 12 Stunden später Nutzerfeedback zu prüfen, und versucht bei Bugs direkt, sie zu beheben — das gefiel, weil es Dinge vorwegnimmt, die Menschen leicht vergessen
  • Claude Mythos ist für die meisten noch nicht öffentlich verfügbar; bekannt ist vor allem seine Leistung bei Coding und Cybersecurity — ein größerer Sprung als üblich und besonders stark in diesen Bereichen

Wer trägt Verantwortung für Jobverdrängung?

  • Dieser Wandel bringt gute und schlechte Effekte zugleich, und weder Zeitpunkt noch Verhältnis lassen sich genau vorhersagen
    • Anthropic befindet sich in einer einzigartigen Position, da seine Produkte zur Ursache von Arbeitslosigkeit etwa unter Software Engineers werden könnten
    • Im Team wird oft über die starke Pflicht gesprochen, kommende Veränderungen offen anzusprechen, den Einsatz der Tools zu vermitteln und die Menschen mitzunehmen
  • Das ist kein Problem, das ein einzelnes Unternehmen lösen kann, und es wäre auch nicht wünschenswert, wenn ein einzelnes Unternehmen das täte — die Lösung könnte falsch sein
    • Es ist eine gesellschaftliche Frage, über die die ganze Gesellschaft diskutieren muss; Anthropic will dazu mit Wirtschaftsberichten, politischen Debatten und der Veröffentlichung eigener Beobachtungen beitragen
  • Einer der Gründe, warum Anthropic trotz Sicherheitsforschung auch Produkte baut, ist, dass Menschen die Technologie selbst erfahren, verstehen und an gesellschaftlichen Reaktionen mitwirken können — wenn man sie wegsperrt, kann kaum jemand eine fundierte Sicht darauf entwickeln

Power User und die KI-Kluft

  • Es besteht die Sorge, dass sich die digitale Kluft in eine KI-Kluft verwandelt; bisherige Daten deuten darauf hin, dass die Menschen mit der besten KI-Nutzungskompetenz ohnehin eher zu den oberen Einkommensgruppen gehören
    • Anthropic hat einige Programme zur Verbesserung des Zugangs, konkrete Namen oder Methoden werden jedoch nicht genannt
  • Die Nutzer mit dem größten Mehrwert sind oft nicht diejenigen, die man erwarten würde
    • Die Gewinner des Hackathons zum Start von Opus 4.7 waren meist keine professionellen Ingenieure, sondern Elektriker, Ärzte oder Schreiner, die Apps bauten; derselbe Trend zeigte sich schon beim vorherigen 4.6-Hackathon
    • Die Modelle sind inzwischen so ausgereift, dass auch Nicht-Spezialisten gut mit ihnen arbeiten können
  • Der Schlüssel für die Einführung in Großunternehmen ist, Arbeitsprozesse so zu verändern, dass Claude im Zentrum steht
    • Ein gut funktionierender Ansatz ist, allen Tokens zu geben und sicheres Experimentieren zu erlauben, damit Ideen von unerwarteten Personen kommen können
    • Die besten Ideen entstehen womöglich nicht beim Senior Engineer, sondern auf einem internen Dashboard eines Buchhalters in der Ecke oder eines GTM-Mitarbeiters
    • Wer heute das Tool am besten nutzt, ist nicht zwangsläufig morgen noch vorne; wichtig ist, dass alle lernen, mit den Tools umzugehen

Ausblick auf das kommende Jahr

  • Im nächsten Jahr wird es viel Verwirrung geben, und große Player werden versuchen, sich anzupassen — viele davon erfolgreich
  • Einige klassische Business-Moats werden schwächer, andere bleiben bestehen
    • Netzwerkeffekte (mehr Nutzer erhöhen den Wert) bleiben unabhängig von KI erhalten
    • Skaleneffekte (sinkende Grenzkosten) bleiben ebenfalls ein natürlicher Vorteil
    • Dagegen werden Wechselkosten schwächer — wenn Claude einen Wechsel von Anbieter A zu B übernehmen kann, ist das kein großer Schutzwall mehr
    • Unternehmen, die auf verschwindende Moats angewiesen sind, geraten unter Druck; viele werden nach neuen Moats suchen
  • Es wird viel größere Innovationen als erwartet geben
    • Neue Ideen werden nicht aus Großkonzernen kommen, sondern aus kleinen Startups mit 1, 2 oder 10 Personen, und ihre Zahl wird explosionsartig steigen
    • Ein Beispiel ist ein Startup zur Materialentdeckung: Nach Steinzeit, Eisenzeit und dem Siliziumzeitalter geht es darum, mit Claude Moleküle und Designs für neue Materialien zu erkunden, um in das nächste Zeitalter einzutreten
    • Was früher kaum finanzierbar war, kann heute von kleinen Teams zu Durchbrüchen führen, die vor 20 Jahren unmöglich gewesen wären
    • Wenn jemand mit tiefem Domänenwissen eine „Claude-Armee“ hinter sich hat, lässt sich weit mehr erreichen als mit einer menschlichen Armee
  • Cherny hat seine Antworten auf X und Threads automatisiert, zieht direkte Interaktion aber vor
    • Er hat die Schleife von Claude Code in eine Routine überführt, die alle 30 Minuten läuft und über die Threads API und X API Feedback einsammelt
    • Direkte Interaktion mit Nutzern ist sein liebster Teil der Arbeit, und selbst Rückmeldungen wie „funktioniert nicht“ sind eine Quelle für Produktverbesserung
    • Claude Code hat viele Mängel und ist weit vom Idealprodukt entfernt, doch Feedback aufzunehmen und sich jeden Tag ein Stück zu verbessern ist der einzige Weg, ein gutes Produkt zu bauen

Noch keine Kommentare.

Noch keine Kommentare.