7 Punkte von popododo0720 2026-02-14 | Noch keine Kommentare. | Auf WhatsApp teilen

In letzter Zeit erscheinen unzählige AI-Coding-Agent-Tools, und der Trend geht zu parallelen Agenten, die gleichzeitig mehrere Dateien ändern. Wenn man sie aber selbst ausprobiert, merkt man schnell eines — die Ergebnisse sind oft ein ziemliches Durcheinander.
Der Agent produziert Code ohne Plan, die Konsistenz zwischen Modulen bricht auf, und dieselben Fehler werden in jeder Session wiederholt. „Schnell viel generieren“ ist nicht automatisch gut. Egal wie hoch die Generierungsgeschwindigkeit ist: Wenn Menschen im Nachhinein mehr Zeit für das Aufräumen brauchen, bringt das wenig.
Deshalb habe ich den Ansatz geändert. Was wäre, wenn man den Agenten bewusst verlangsamt, aber dafür Struktur erzwingt und so die Endqualität verbessert?
Ich habe eine Workflow-Erweiterung für den Pi Coding Agent (@mariozechner/pi-coding-agent) gebaut, und der Kern ist, dem Agenten einen Entwicklungszyklus mit 6 Phasen aufzuzwingen:
📝 Plan → 🔍 Verify Plan → 🔨 Implement → ✅ Verify Impl → 🧠 Compound → 🎉 Done

  1. Tool-Sperren pro Phase
    Außerhalb der Phase Implement werden Datei-Bearbeitungstools komplett blockiert. Auch Bash-Befehle wie rm, mv, sed -i werden in schreibgeschützten Phasen blockiert. Die AI kann den Code also gar nicht anfassen, bevor sie einen Plan erstellt hat.
  2. Parallele adversariale Multi-Model-Verifikation
    Plan und Implementierungsergebnisse werden gleichzeitig von mehreren LLMs überprüft. Das ist nicht nur ein einfacher Code-Review, sondern ein Ansatz, bei dem konkrete Szenarien erzeugt werden, um den Code gezielt zu brechen und anzugreifen. Die Einstufung erfolgt nach Schweregrad in 🔴 CRITICAL / 🟡 WARNING / 🔵 INFO, und sobald auch nur ein CRITICAL auftaucht, kann die Phase nicht bestanden werden.
  3. Compound-Lernen & Projektgedächtnis
    Nach jedem Zyklus werden Muster, Fehlerquellen (gotchas) und Architekturentscheidungen automatisch festgehalten. Dieses Gedächtnis wird in .pi/workflow-memory.json gespeichert und bleibt auch über Session-Wechsel hinweg erhalten. So wird möglich: „Gestern haben wir uns an diesem Teil festgefahren, also wiederholen wir das heute nicht.“
  4. Repo Map (AST + PageRank)
    Mit web-tree-sitter werden die Symbole des gesamten Projekts extrahiert (Funktionen, Klassen, Interfaces usw.), ein Import-Graph aufgebaut und per PageRank die Wichtigkeit einzelner Dateien bewertet. So lässt sich die Projektstruktur innerhalb eines Token-Budgets (Standard: 2048) erfassen, sodass der Agent arbeitet, während er bereits versteht, „wie dieses Projekt aufgebaut ist“. Unterstützt werden 18 Sprachen.
    Weitere Merkmale
  • TODO-System — große Tasks werden in TODO-Einheiten zerlegt, und für jedes TODO wird der Zyklus Implement → Verify → Compound unabhängig durchlaufen
  • Git-Automatisierung — automatisches Commit/Push an jeder TODO-Grenze; bei einem dirty tree wird zunächst Bereinigung erzwungen
  • Benutzerdefinierte Checks — wenn Markdown-Dateien in docs/checks/ abgelegt werden, lassen sich projektspezifische Verifikationskriterien hinzufügen
  • Kontext-Management — Trennung zwischen minimalem, immer injiziertem Kontext und On-Demand-Kontext, der nur bei Bedarf geladen wird, um keine Tokens zu verschwenden
    Philosophie
    Es geht nicht darum, dass parallele Agenten schlecht wären. Ich denke nur, dass parallele Generierung ohne Struktur im Grunde technische Schulden parallel erzeugt. Diese Erweiterung startet mit der Idee: „Lassen wir AI die Arbeit machen, aber mit derselben Disziplin, nach der auch Menschen arbeiten.“
    Geschrieben zu 100 % in TypeScript, Installation per npm install plus einem Symlink.
    GitHub: https://github.com/popododo0720/pi-stuff
    Feedback willkommen!

Noch keine Kommentare.

Noch keine Kommentare.