9 Überlebensskills im Zeitalter des Agentic Engineering
(flowkater.io)Das Wochenende des Erfinders des Vibe Coding
- Karpathy hat ein Wochenendprojekt einem Agenten übergeben. Er gab nur IP, Benutzernamen, Passwort und Ziel vor, und 30 Minuten später war alles fertig
- Eine Arbeitsweise, bei der man 99 % der Zeit den Code nicht selbst schreibt, sondern den Agenten anweist und überwacht — „Agentic Engineering“
- Doch obwohl 60 % der Entwickler KI nutzen, liegt die vollständige Delegation nur bei 0–20 % — das Delegationsparadox. „Do you trust your agents?“ Für die meisten lautet die Antwort noch immer „Nein“
① Zerlegungsfähigkeit (Decomposition)
- Wenn man sagt „Erstelle mir eine Registrierungsfunktion“, kommt zwar irgendetwas heraus. Das Problem ist, dass es mit hoher Wahrscheinlichkeit nicht das ist, was ich wollte
- Beim AddPlan-Bildschirm habe ich dem Agenten nur das PRD hingeworfen und ihn machen lassen; das führte zu Dutzenden Pingpong-Runden und kostete einen halben Tag
- Mit einem sokratischen Dialog mit der KI: 5 Minuten Interview → Edge Cases vorab sortieren → auf 2–3 Korrekturrunden reduzieren
- Sich vor der Implementierung Zeit zum Nachdenken zu nehmen — diese 5 Minuten sparen 4 Stunden
② Kontextdesign (Context Architecture)
- AGENTS.md gut zu schreiben ist wichtig, aber wenn die Code-Architektur selbst gut entworfen ist, ist die Geschwindigkeit, mit der der Agent den Kontext versteht, völlig anders
- In einer flachen Verzeichnisstruktur verirrte sich der Agent; nach einer Neuorganisation in featurebasierte Verzeichnisse verbesserte sich das sofort
- Armin Ronacher: „Tools müssen darauf vorbereitet sein, dass ein LLM-Chaosaffe sie komplett falsch benutzt“
③ Definition von fertig (Definition of Done)
- Ich ließ ein CLI-Projekt über Nacht laufen, doch es war schon nach einer Stunde beendet — nur Typdefinitionen waren eingerichtet, die Business-Logik war eine leere Hülle
- Beim zweiten Versuch schrieb der Agent sogar die Tests zu seinem eigenen Vorteil um
- Das „fertig“ des Agenten ist nicht dasselbe wie mein „fertig“
- Elvis’ siebenstufiges DoD-System (PR→CI→3 Code-Reviews→Telegram) ist extrem, zeigt aber die Richtung
④ Fehlerbehebung (Failure Recovery Loop)
- In der Redistribution Engine hatten dieselben Parameter je nach Funktion unterschiedliche Semantik → wenn man A reparierte, ging B kaputt, in einer Endlosschleife
- Mit demselben Prompt erneut zu versuchen, ist so, als würde man immer wieder mit dem Kopf in dieselbe Wand rennen
- Wenn man Fehler in drei Typen einteilt (fehlender Kontext, falsche Richtung, struktureller Konflikt), wird die Gegenmaßnahme klar
- Ein „Must NOT Have“-Guardrail hat die Endlosschleife durchbrochen
⑤ Beobachtbarkeit (Observability)
- liquidglass dem Agenten zu überlassen und zu sagen „Sieht komisch aus ... lassen wir es einfach so“ war die teuerste Entscheidung
- 20 Dateien waren ineinander verheddert, ein Rollback unmöglich
- Danach: Tracer-Bullet-Strategie + Blueprint — bei einer Technik, die man zum ersten Mal einsetzt, lässt sich der Blueprint nicht im Voraus zeichnen; der Tracer Bullet zeichnet ihn schnell vor
- Beobachtbarkeit schafft Vertrauen, und Vertrauen ermöglicht Delegation
⑥ Speicherkonzept (Memory Architecture)
- Wenn man drei Tage am Stück arbeitet, verliert man jeden Morgen 15 Minuten damit, den Kontext erneut zu erklären
- Mit Claude Code hooks wird beim Sitzungsende automatisch Speicher extrahiert → Wiederherstellung in 5 Sekunden in der nächsten Sitzung
- Das Team von Boris Cherny checkt CLAUDE.md in git ein, damit das ganze Team es gemeinsam nutzt
- Eine Struktur, in der nicht individuelles Gedächtnis, sondern Teamgedächtnis an den Agenten weitergegeben wird
⑦ Paralleles Management (Parallel Orchestration)
- Boris Cherny betreibt 10–15 parallele Sitzungen gleichzeitig
- Die Erfahrung aus meiner Zeit als CTO, in der ich sechs Squads gemanagt habe, ist erstaunlich ähnlich zum Management paralleler Agenten
- Nicht ADHS, sondern bewusstes Multitasking = Management
- Menschen stellen Fragen, Agenten dagegen fragen nicht, sondern machen nach eigenem Ermessen weiter — deshalb ist Vorausplanung wichtiger
⑧ Entwurf von Abstraktionsebenen (Abstraction Layering)
- Level 0 (direkt coden) → Level 1 (Agenten instruieren) → Level 2 (Orchestrator) → Level 3 (Meta-Design)
- Die Erfahrung, eine tägliche 20-Minuten-Routine in einen Skill zu verwandeln und auf 2 Minuten zu verkürzen
- Compounding Engineering — Projekte sind kein Spiel mit einer Ziellinie, sondern ein Spiel des Zinseszinseffekts. Frühere Sitzungen wirken sich später kumulativ aus
⑨ Gespür (Taste)
- Von KI erstelltes Design liegt bei 60–70 Punkten. In dem Moment, in dem Ellies Design dazukam, stellte sich das Gefühl ein: „Ah, das funktioniert“
- Ein von KI erstellter Post zur Aufbereitung von Informationen bekam 0 Likes, ein impulsiv geschriebener Einzeiler zum Angeben 30.000 Aufrufe
- KinglyCrows „No Skill, No Taste“ — LLMs haben die Einstiegshürde beim Skill gesenkt, aber die echte Hürde namens Taste eher noch verstärkt
- Chris Lattner: „Je stärker die Implementierung automatisiert wird, desto wichtiger werden Design, Urteilsvermögen und Gespür“
- In einem Zeitalter, in dem 80 % überfluten, entsteht Differenzierung aus den verbleibenden 20 %
Zum Schluss
- Zu Ende gegangen ist nur das Tippen, nicht das Engineering
- Diese neun Punkte waren schon vor der KI Eigenschaften guter Ingenieure
- Der Hebel guter Architektur ist größer geworden, aber auch der Schaden schlechter Architektur
- Der Star der Show ist nicht die KI, sondern der Ingenieur, der KI gut einzusetzen weiß
3 Kommentare
Wenn man nur die SSoT konsequent einhält, lassen sich Halluzinationen deutlich reduzieren. Und Tokens spart man auch.
„Nicht das Engineering ist vorbei, sondern nur das Tippen“
Dem stimme ich zu. Haha
Vielen Dank. Ich hatte ein bisschen Angst, weil mit cowork etwas aufgetaucht ist, das sogar als Server fungiert, wenn man nur den PC eingeschaltet lässt, aber das beruhigt mich etwas, und ich kann mir jetzt vorstellen, wie sich das in Zukunft verändern wird, haha.