9 Überlebensskills im Zeitalter des Agentic Engineering

flowkater · 2026-03-01T14:15:21+09:00

Das Wochenende des Erfinders des Vibe Coding Karpathy hat ein Wochenendprojekt einem Agenten übergeben. Er gab nur IP, Benutzernamen, Passwort und Ziel vor, und 30 Minuten später war alles fertig Eine Arbeitsweise, bei der man 99 % der Zeit den Code nicht selbst schreibt, sondern den Agenten anweist und überwacht — „Agentic Engineering“ Doch obwohl 60 % der Entwickler KI nutzen, liegt die vollständige Delegation nur bei 0–20 % — das Delegationsparadox. „Do you trust your agents?“ Für die meisten lautet die Antwort noch immer „Nein“ ① Zerlegungsfähigkeit (Decomposition) Wenn man sagt „Erstelle mir eine Registrierungsfunktion“, kommt zwar irgendetwas heraus. Das Problem ist, dass es mit hoher Wahrscheinlichkeit nicht das ist, was ich wollte Beim AddPlan-Bildschirm habe ich dem Agenten nur das PRD hingeworfen und ihn machen lassen; das führte zu Dutzenden Pingpong-Runden und kostete einen halben Tag Mit einem sokratischen Dialog mit der KI: 5 Minuten Interview → Edge Cases vorab sortieren → auf 2–3 Korrekturrunden reduzieren Sich vor der Implementierung Zeit zum Nachdenken zu nehmen — diese 5 Minuten sparen 4 Stunden ② Kontextdesign (Context Architecture) AGENTS.md gut zu schreiben ist wichtig, aber wenn die Code-Architektur selbst gut entworfen ist, ist die Geschwindigkeit, mit der der Agent den Kontext versteht, völlig anders In einer flachen Verzeichnisstruktur verirrte sich der Agent; nach einer Neuorganisation in featurebasierte Verzeichnisse verbesserte sich das sofort Armin Ronacher: „Tools müssen darauf vorbereitet sein, dass ein LLM-Chaosaffe sie komplett falsch benutzt“ ③ Definition von fertig (Definition of Done) Ich ließ ein CLI-Projekt über Nacht laufen, doch es war schon nach einer Stunde beendet — nur Typdefinitionen waren eingerichtet, die Business-Logik war eine leere Hülle Beim zweiten Versuch schrieb der Agent sogar die Tests zu seinem eigenen Vorteil um Das „fertig“ des Agenten ist nicht dasselbe wie mein „fertig“ Elvis’ siebenstufiges DoD-System (PR→CI→3 Code-Reviews→Telegram) ist extrem, zeigt aber die Richtung ④ Fehlerbehebung (Failure Recovery Loop) In der Redistribution Engine hatten dieselben Parameter je nach Funktion unterschiedliche Semantik → wenn man A reparierte, ging B kaputt, in einer Endlosschleife Mit demselben Prompt erneut zu versuchen, ist so, als würde man immer wieder mit dem Kopf in dieselbe Wand rennen Wenn man Fehler in drei Typen einteilt (fehlender Kontext, falsche Richtung, struktureller Konflikt), wird die Gegenmaßnahme klar Ein „Must NOT Have“-Guardrail hat die Endlosschleife durchbrochen ⑤ Beobachtbarkeit (Observability) liquidglass dem Agenten zu überlassen und zu sagen „Sieht komisch aus ... lassen wir es einfach so“ war die teuerste Entscheidung 20 Dateien waren ineinander verheddert, ein Rollback unmöglich Danach: Tracer-Bullet-Strategie + Blueprint — bei einer Technik, die man zum ersten Mal einsetzt, lässt sich der Blueprint nicht im Voraus zeichnen; der Tracer Bullet zeichnet ihn schnell vor Beobachtbarkeit schafft Vertrauen, und Vertrauen ermöglicht Delegation ⑥ Speicherkonzept (Memory Architecture) Wenn man drei Tage am Stück arbeitet, verliert man jeden Morgen 15 Minuten damit, den Kontext erneut zu erklären Mit Claude Code hooks wird beim Sitzungsende automatisch Speicher extrahiert → Wiederherstellung in 5 Sekunden in der nächsten Sitzung Das Team von Boris Cherny checkt CLAUDE.md in git ein, damit das ganze Team es gemeinsam nutzt Eine Struktur, in der nicht individuelles Gedächtnis, sondern Teamgedächtnis an den Agenten weitergegeben wird ⑦ Paralleles Management (Parallel Orchestration) Boris Cherny betreibt 10–15 parallele Sitzungen gleichzeitig Die Erfahrung aus meiner Zeit als CTO, in der ich sechs Squads gemanagt habe, ist erstaunlich ähnlich zum Management paralleler Agenten Nicht ADHS, sondern bewusstes Multitasking = Management Menschen stellen Fragen, Agenten dagegen fragen nicht, sondern machen nach eigenem Ermessen weiter — deshalb ist Vorausplanung wichtiger ⑧ Entwurf von Abstraktionsebenen (Abstraction Layering) Level 0 (direkt coden) → Level 1 (Agenten instruieren) → Level 2 (Orchestrator) → Level 3 (Meta-Design) Die Erfahrung, eine tägliche 20-Minuten-Routine in einen Skill zu verwandeln und auf 2 Minuten zu verkürzen Compounding Engineering — Projekte sind kein Spiel mit einer Ziellinie, sondern ein Spiel des Zinseszinseffekts. Frühere Sitzungen wirken sich später kumulativ aus ⑨ Gespür (Taste) Von KI erstelltes Design liegt bei 60–70 Punkten. In dem Moment, in dem Ellies Design dazukam, stellte sich das Gefühl ein: „Ah, das funktioniert“ Ein von KI erstellter Post zur Aufbereitung von Informationen bekam 0 Likes, ein impulsiv geschriebener Einzeiler zum Angeben 30.000 Aufrufe KinglyCrows „No Skill, No Taste“ — LLMs haben die Einstiegshürde beim Skill gesenkt, aber die echte Hürde namens Taste eher noch verstärkt Chris Lattner: „Je stärker die Implementierung automatisiert wird, desto wichtiger werden Design, Urteilsvermögen und Gespür“ In einem Zeitalter, in dem 80 % überfluten, entsteht Differenzierung aus den verbleibenden 20 % Zum Schluss Zu Ende gegangen ist nur das Tippen, nicht das Engineering Diese neun Punkte waren schon vor der KI Eigenschaften guter Ingenieure Der Hebel guter Architektur ist größer geworden, aber auch der Schaden schlechter Architektur Der Star der Show ist nicht die KI, sondern der Ingenieur, der KI gut einzusetzen weiß

Das Wochenende des Erfinders des Vibe Coding

Karpathy hat ein Wochenendprojekt einem Agenten übergeben. Er gab nur IP, Benutzernamen, Passwort und Ziel vor, und 30 Minuten später war alles fertig
Eine Arbeitsweise, bei der man 99 % der Zeit den Code nicht selbst schreibt, sondern den Agenten anweist und überwacht — „Agentic Engineering“
Doch obwohl 60 % der Entwickler KI nutzen, liegt die vollständige Delegation nur bei 0–20 % — das Delegationsparadox. „Do you trust your agents?“ Für die meisten lautet die Antwort noch immer „Nein“

① Zerlegungsfähigkeit (Decomposition)

Wenn man sagt „Erstelle mir eine Registrierungsfunktion“, kommt zwar irgendetwas heraus. Das Problem ist, dass es mit hoher Wahrscheinlichkeit nicht das ist, was ich wollte
Beim AddPlan-Bildschirm habe ich dem Agenten nur das PRD hingeworfen und ihn machen lassen; das führte zu Dutzenden Pingpong-Runden und kostete einen halben Tag
Mit einem sokratischen Dialog mit der KI: 5 Minuten Interview → Edge Cases vorab sortieren → auf 2–3 Korrekturrunden reduzieren
Sich vor der Implementierung Zeit zum Nachdenken zu nehmen — diese 5 Minuten sparen 4 Stunden

② Kontextdesign (Context Architecture)

AGENTS.md gut zu schreiben ist wichtig, aber wenn die Code-Architektur selbst gut entworfen ist, ist die Geschwindigkeit, mit der der Agent den Kontext versteht, völlig anders
In einer flachen Verzeichnisstruktur verirrte sich der Agent; nach einer Neuorganisation in featurebasierte Verzeichnisse verbesserte sich das sofort
Armin Ronacher: „Tools müssen darauf vorbereitet sein, dass ein LLM-Chaosaffe sie komplett falsch benutzt“

③ Definition von fertig (Definition of Done)

Ich ließ ein CLI-Projekt über Nacht laufen, doch es war schon nach einer Stunde beendet — nur Typdefinitionen waren eingerichtet, die Business-Logik war eine leere Hülle
Beim zweiten Versuch schrieb der Agent sogar die Tests zu seinem eigenen Vorteil um
Das „fertig“ des Agenten ist nicht dasselbe wie mein „fertig“
Elvis’ siebenstufiges DoD-System (PR→CI→3 Code-Reviews→Telegram) ist extrem, zeigt aber die Richtung

④ Fehlerbehebung (Failure Recovery Loop)

In der Redistribution Engine hatten dieselben Parameter je nach Funktion unterschiedliche Semantik → wenn man A reparierte, ging B kaputt, in einer Endlosschleife
Mit demselben Prompt erneut zu versuchen, ist so, als würde man immer wieder mit dem Kopf in dieselbe Wand rennen
Wenn man Fehler in drei Typen einteilt (fehlender Kontext, falsche Richtung, struktureller Konflikt), wird die Gegenmaßnahme klar
Ein „Must NOT Have“-Guardrail hat die Endlosschleife durchbrochen

⑤ Beobachtbarkeit (Observability)

liquidglass dem Agenten zu überlassen und zu sagen „Sieht komisch aus ... lassen wir es einfach so“ war die teuerste Entscheidung
20 Dateien waren ineinander verheddert, ein Rollback unmöglich
Danach: Tracer-Bullet-Strategie + Blueprint — bei einer Technik, die man zum ersten Mal einsetzt, lässt sich der Blueprint nicht im Voraus zeichnen; der Tracer Bullet zeichnet ihn schnell vor
Beobachtbarkeit schafft Vertrauen, und Vertrauen ermöglicht Delegation

⑥ Speicherkonzept (Memory Architecture)

Wenn man drei Tage am Stück arbeitet, verliert man jeden Morgen 15 Minuten damit, den Kontext erneut zu erklären
Mit Claude Code hooks wird beim Sitzungsende automatisch Speicher extrahiert → Wiederherstellung in 5 Sekunden in der nächsten Sitzung
Das Team von Boris Cherny checkt CLAUDE.md in git ein, damit das ganze Team es gemeinsam nutzt
Eine Struktur, in der nicht individuelles Gedächtnis, sondern Teamgedächtnis an den Agenten weitergegeben wird

⑦ Paralleles Management (Parallel Orchestration)

Boris Cherny betreibt 10–15 parallele Sitzungen gleichzeitig
Die Erfahrung aus meiner Zeit als CTO, in der ich sechs Squads gemanagt habe, ist erstaunlich ähnlich zum Management paralleler Agenten
Nicht ADHS, sondern bewusstes Multitasking = Management
Menschen stellen Fragen, Agenten dagegen fragen nicht, sondern machen nach eigenem Ermessen weiter — deshalb ist Vorausplanung wichtiger

⑧ Entwurf von Abstraktionsebenen (Abstraction Layering)

Level 0 (direkt coden) → Level 1 (Agenten instruieren) → Level 2 (Orchestrator) → Level 3 (Meta-Design)
Die Erfahrung, eine tägliche 20-Minuten-Routine in einen Skill zu verwandeln und auf 2 Minuten zu verkürzen
Compounding Engineering — Projekte sind kein Spiel mit einer Ziellinie, sondern ein Spiel des Zinseszinseffekts. Frühere Sitzungen wirken sich später kumulativ aus

⑨ Gespür (Taste)

Von KI erstelltes Design liegt bei 60–70 Punkten. In dem Moment, in dem Ellies Design dazukam, stellte sich das Gefühl ein: „Ah, das funktioniert“
Ein von KI erstellter Post zur Aufbereitung von Informationen bekam 0 Likes, ein impulsiv geschriebener Einzeiler zum Angeben 30.000 Aufrufe
KinglyCrows „No Skill, No Taste“ — LLMs haben die Einstiegshürde beim Skill gesenkt, aber die echte Hürde namens Taste eher noch verstärkt
Chris Lattner: „Je stärker die Implementierung automatisiert wird, desto wichtiger werden Design, Urteilsvermögen und Gespür“
In einem Zeitalter, in dem 80 % überfluten, entsteht Differenzierung aus den verbleibenden 20 %

Zum Schluss

Zu Ende gegangen ist nur das Tippen, nicht das Engineering
Diese neun Punkte waren schon vor der KI Eigenschaften guter Ingenieure
Der Hebel guter Architektur ist größer geworden, aber auch der Schaden schlechter Architektur
Der Star der Show ist nicht die KI, sondern der Ingenieur, der KI gut einzusetzen weiß

9 Überlebensskills im Zeitalter des Agentic Engineering

Verwandte Beiträge

3 Kommentare