- Claude Code wird sowohl in persönlichen Projekten als auch in Enterprise-Monorepo-Umgebungen intensiv genutzt; der Artikel ordnet die Kernkomponenten und den praktischen Einsatz fortgeschrittener Funktionen ein
- Der Schlüssel zu effektivem Agenten-Einsatz liegt nicht im Ausgabestil oder der UI, sondern in der Qualität des finalen PRs; Ziel ist Delegation nach dem Prinzip „shoot and forget“
- Das Zentrum der Codebasis ist die Datei
CLAUDE.md, die als „Verfassung“ die Verhaltensregeln des Agenten und die Nutzung von Tools definiert
- Durch Funktionen wie Kontext-Management, Slash-Commands, Subagents, Hooks und GitHub Action (GHA) steigen Kollaborations- und Automatisierungsgrad
- Der Unterschied zwischen Skills und MCP (Model Context Protocol) wird klar herausgearbeitet, um eine flexible, skriptzentrierte Agenten-Struktur zu betonen
- Geboten wird ein praxisnaher Leitfaden, wie sich Claude Code von einem einfachen CLI-Tool zu einer Enterprise-tauglichen KI-Entwicklungsinfrastruktur ausbauen lässt
- Ich nutze Claude Code sehr intensiv
- Hobbyprojekte: mehrmals pro Woche auf einer VM ausgeführt, mit
--dangerously-skip-permissions, um aufkommende Ideen sofort in Code umzusetzen
- Bei der Arbeit baut unser Team Regeln und Tools für AI-IDEs auf; allein durch Codegenerierung verbraucht unser Engineering-Team jeden Monat Token in Milliardenhöhe
- Der Markt für CLI-Agenten ist mit Claude Code, Gemini CLI, Cursor und Codex CLI dicht besetzt, aber der eigentliche Wettbewerb findet zwischen Anthropic und OpenAI statt
- Gespräche mit Entwicklerinnen und Entwicklern zeigen jedoch, dass die Tool-Wahl oft von oberflächlichen Faktoren abhängt
- etwa einer „glücklichen“ Feature-Implementierung oder dem „Vibe“ des bevorzugten System-Prompts
- Aktuell sind all diese Tools insgesamt auf einem sehr hohen Niveau
- Manche fokussieren sich zu stark auf Ausgabestil oder UI
- Schmeicheleien wie „you're absolutely right!“ sind kein besonders erwähnenswerter Bug
- Eher sind sie ein Signal dafür, dass Nutzer zu stark in den Loop eingreifen
- Meine zentrale Nutzungsphilosophie ist „Shoot and Forget“
- Die Reihenfolge lautet: delegieren, Kontext setzen, Aufgabe ausführen
- Beurteilt wird das Tool am finalen PR; entscheidend ist das Ergebnis, nicht der Weg dorthin
- Dieser Text ist eine Reflexion über das gesamte Ökosystem, basierend auf den Erfahrungen der letzten Monate mit Claude Code
- Fast alle Funktionen, die ich nutze (und auch die, die ich nicht nutze)
- die grundlegende Datei
CLAUDE.md
- benutzerdefinierte Slash-Commands
- die leistungsstarke Welt von Subagents, Hooks und GitHub Actions
- Der Text ist recht lang geworden, daher eher als Nachschlagewerk als zum kompletten Durchlesen empfohlen
CLAUDE.md: die Verfassung des Agenten
Compact, Context, Clear: Verwaltung des Kontextfensters
- Mit dem Kommando
/context die Auslastung des 200k-Token-Fensters prüfen
- Selbst bei Sonnet-1M ist unklar, ob das gesamte Kontextfenster effektiv genutzt wird
- Neue Sessions im Monorepo verbrauchen standardmäßig etwa 20k Token (10 %), die restlichen 180k sind für Änderungen vorgesehen (und schnell aufgebraucht)
- Drei zentrale Workflows
/compact (vermeiden): automatische Komprimierung ist intransparent, fehleranfällig und unzureichend optimiert, daher möglichst vermeiden
/clear + /catchup (einfacher Neustart): Standard-Reboot; mit /clear den Zustand löschen und dann mit dem benutzerdefinierten /catchup alle geänderten Dateien im Git-Branch lesen
- „Document & Clear“ (komplexer Neustart): für große Aufgaben; Claude schreibt Plan und Fortschritt in eine
.md-Datei → /clear → in einer neuen Session .md lesen und fortsetzen
Benutzerdefinierte Slash-Commands
- Slash-Commands sind nichts weiter als einfache Shortcuts für häufig verwendete Prompts
- Minimales Setup
/catchup: ein Prompt, um alle geänderten Dateien im Git-Branch zu lesen
/pr: Helfer zum Aufräumen von Code, Staging und Vorbereiten des PRs
- Eine komplexe Liste benutzerdefinierter Kommandos ist ein Anti-Pattern
- Der Kern eines Agenten wie Claude: Mit fast jeder natürlichsprachlichen Eingabe nützliche, kombinierbare Ergebnisse erzeugen
- Engineers (oder Nicht-Engineers) zum Lernen einer Pflichtliste von „Magic Commands“ für ihre Aufgaben zu zwingen = gescheitert
- Ziel ist der Aufbau eines Agenten mit intuitiverer
CLAUDE.md und besseren Tools
Benutzerdefinierte Subagents
- Theoretisch starke Funktion für Context-Management
- Komplexe Aufgaben:
X Token Eingabekontext + Y Token Arbeitskontext + Z Token Antwort
N Aufgaben = (X + Y + Z) * N Token im Hauptfenster
- Subagent-Lösung:
(X + Y) * N Aufgaben an spezialisierte Agents delegieren, nur die finale Antwort mit Z Token zurückgeben
- In der Praxis erzeugen benutzerdefinierte Subagents zwei neue Probleme
- Context-Gatekeeping: Beim Erstellen eines
PythonTests-Subagents wird der gesamte Testkontext vor dem Haupt-Agent verborgen → ganzheitliches Schlussfolgern unmöglich → der Aufruf des Subagents wird erzwungen, nur um zu verstehen, wie der eigene Code validiert wird
- Erzwungener menschlicher Workflow: Claude wird in einen starren, von Menschen definierten Workflow gezwungen → vorzugeben, wie delegiert werden soll, ist selbst das Problem, das der Agent eigentlich lösen müsste
-
Persönlich bevorzuge ich die Funktion Task(...)
- Mit der eingebauten
Task(...)-Funktion von Claude wird ein Klon eines General-Purpose-Agents erzeugt
- Den gesamten zentralen Kontext in
CLAUDE.md ablegen
- Der Haupt-Agent entscheidet selbst, wann und wie er Aufgaben an seine eigene Kopie delegiert
- Der Vorteil der Kontext-Einsparung von Subagents bleibt erhalten, die Nachteile entfallen
- Der Agent verwaltet seine eigene Orchestrierung dynamisch
- In "Building Multi-Agent Systems (Part 2)" als "Master-Clone"-Architektur bezeichnet
- Deutlich bevorzugt gegenüber dem Modell "Lead-Specialist", zu dem benutzerdefinierte Subagents verleiten
Resume, Continue, History
- Nutzung auf Grundniveau
claude --resume und claude --continue werden häufig verwendet
- Zum Neustart eines fehlerhaften Terminals oder zum schnellen Hochfahren einer alten Session
- Eine Session von vor ein paar Tagen mit
claude --resume wiederaufnehmen, zusammenfassen, wie ein bestimmter Fehler überwunden wurde → CLAUDE.md und interne Tools verbessern
- Fortgeschrittene Nutzung
- Claude Code speichert den gesamten Session-Verlauf in
~/.claude/projects/
- Es gibt Skripte, die die rohen Verlaufsdaten der Sessions nutzen
- Meta-Analyse der Logs ausführen: gemeinsame Ausnahmen, Berechtigungsanfragen und Fehlermuster suchen → zielgerichteten Kontext für den Agent verbessern
Hooks
- In Enterprise-Repos zentral: in Hobbyprojekten nicht verwendet
- Deterministische „must-do“-Regeln als Ergänzung zu den „should-do“-Empfehlungen in
CLAUDE.md
- Zwei Typen
- Block-at-Submit-Hook: Hauptstrategie
- Mit einem
PreToolUse-Hook alle Bash(git commit)-Befehle wrappen
- Die Datei
/tmp/agent-pre-commit-pass prüfen (wird vom Testskript nur erzeugt, wenn alle Tests erfolgreich sind)
- Wenn die Datei fehlt, wird der Commit blockiert → Claude wird in eine „testen-korrigieren“-Schleife gezwungen, bis der Build erfolgreich ist
- Hint-Hook: einfacher nicht blockierender Hook, der „fire-and-forget“-Feedback gibt, wenn der Agent eine suboptimale Entscheidung trifft
- Write-Phase-Blocking-Hooks werden bewusst nicht verwendet (
Edit oder Write)
- Das Blockieren des Agents mitten im Plan führt zu Verwirrung oder „Frustration“
- Es ist deutlich wirksamer, das finale Ergebnis nach Abschluss der Aufgabe in der Commit-Phase zu prüfen
Planning-Modus
- Bei „großen“ Feature-Änderungen mit einer AI IDE ist Planung essenziell
- Hobbyprojekte: ausschließliche Nutzung des eingebauten Planning-Modus
- Eine Methode, sich vor dem Start von Claude abzustimmen
- „Prüf-Checkpoints“ definieren, an denen gebaut werden soll und die Arbeit unterbrochen werden muss, um Ergebnisse zu zeigen
- Regelmäßige Nutzung schafft eine starke Intuition dafür, welcher minimale Kontext nötig ist, damit Claude gute Pläne erstellt, ohne die Implementierung zu ruinieren
- Enterprise-Monorepo: Beginn des Rollouts eines benutzerdefinierten Planning-Tools auf Basis des Claude Code SDK
- Ähnlich dem nativen Planning-Modus, aber mit einem fokussierten Prompt, der die Ausgabe an bestehende technische Designformate anpasst
- Interne Best Practices standardmäßig durchsetzen (von Code-Struktur bis zu Datenschutz und Sicherheit)
- Engineers können neue Features wie Senior-Architekten „vibe-planen“ (zumindest ist das die Idee)
Skills
- Zustimmung zur Meinung von Simon Willison: Skills sind (wahrscheinlich) ein größeres Ding als MCP
- Dreistufige Evolution des Mental Models für Agentenautonomie
- Single Prompt: dem Agent den gesamten Kontext in einem einzigen riesigen Prompt geben (fragil, nicht skalierbar)
- Tool Calling: das „klassische“ Agent-Modell, bei dem Tools von Hand gebaut und die Realität für den Agent abstrahiert wird (verbessert, aber erzeugt neue Abstraktionen und Kontext-Engpässe)
- Scripting: dem Agent Zugriff auf die rohe Umgebung geben (Binärdateien, Skripte, Dokumentation) → der Agent schreibt spontan Code, um damit zu interagieren
- Agent Skills sind die offensichtliche nächste Funktion: die formale Produktisierung der „Scripting“-Schicht
- Wer die CLI gegenüber MCP bevorzugt, hat die Vorteile von Skills bereits implizit erhalten
- Die Datei
SKILL.md ist eine besser organisierte, teilbare und auffindbare Methode, diese CLI-Tools und Skripte zu dokumentieren und dem Agent zugänglich zu machen
- Skills sind die richtige Abstraktion: Sie formalisieren ein robusteres und flexibleres Agent-Modell auf Basis von „Scripting“ statt des starren, API-artigen Modells, für das MCP steht
MCP (Model Context Protocol)
- MCP ist durch Skills nicht tot (siehe "Everything Wrong with MCP")
- Früheres Problem: Viele bauten schreckliche, kontextlastige MCPs mit Dutzenden von Tools, die nur eine REST API spiegeln (
read_thing_a(), read_thing_b(), update_thing_c())
- Das „Scripting“-Modell (durch Skills formalisiert) ist der bessere Weg, aber es braucht weiterhin einen sicheren Weg für den Umgebungszugriff → das ist die neue, stärker fokussierte Rolle von MCP
-
Neue Rolle von MCP: Daten-Gateway
- Statt aufgeblähter APIs ein einfaches, sicheres Gateway mit einigen wenigen mächtigen High-Level-Tools bereitstellen
download_raw_data(filters…)
take_sensitive_gated_action(args…)
execute_code_in_environment_with_state(code…)
- Die Rolle von MCP: Authentifizierung, Networking und Sicherheitsgrenzen für den Agent verwalten und sich dann nicht weiter einmischen, statt die Realität für ihn zu abstrahieren
- Einen Einstiegspunkt für den Agent bereitstellen → der Agent erledigt die eigentliche Arbeit mit Scripting und
markdown-Kontext
- Das einzige MCP, das derzeit verwendet wird: Playwright (sinnvoll, weil die Umgebung komplex und zustandsbehaftet ist)
- Alle zustandslosen Tools (Jira, AWS, GitHub) werden auf eine einfache CLI migriert
Claude Code SDK
- Claude Code ist nicht nur eine interaktive CLI, sondern auch ein leistungsstarkes SDK zum Aufbau völlig neuer Agenten für Coding- und Nicht-Coding-Aufgaben
- Wird bei den meisten neuen Hobbyprojekten inzwischen als Standard-Agenten-Framework anstelle von Tools wie LangChain/CrewAI verwendet
- Drei zentrale Einsatzarten
- Paralleles Scripting im großen Maßstab: Bei umfangreichen Refactorings, Bugfixes und Migrationen wird kein interaktiver Chat verwendet
- Ein einfaches Bash-Skript schreiben, das
claude -p "in /pathA change all refs from foo to bar" parallel aufruft
- Deutlich besser skalierbar und kontrollierbarer, als einen Hauptagenten Dutzende von Subagent-Aufgaben verwalten zu lassen
- Interne Chat-Tools bauen: Perfekt, um komplexe Prozesse für nichttechnische Nutzer in eine einfache Chat-Oberfläche zu kapseln
- Beispiel: ein Installer, der bei Fehlern auf das Claude Code SDK zurückfällt, um Nutzerprobleme zu lösen
- Beispiel: ein internes "v0-at-home"-Tool, mit dem das Design-Team Mockup-Frontends mit dem internen UI-Framework vibe-coden kann (gewährleistet hohe Ideen-Treue und lässt sich direkter aus Frontend-Produktionscode nutzen)
- Schnelles Agenten-Prototyping: der häufigste Anwendungsfall, nicht nur fürs Coding
- Wenn es eine Idee für eine Agenten-Aufgabe gibt (z. B. ein „Threat-Investigation-Agent“ mit einer Custom CLI oder unter Verwendung von MCP)
- Vor dem Commit des vollständigen Deployment-Scaffoldings mit dem Claude Code SDK schnell einen Prototyp bauen und testen
Claude Code GitHub Action (GHA)
- Eine der Lieblingsfunktionen und zugleich eine der am meisten unterschätzten: ein einfaches Konzept (Claude Code in GHA ausführen), aber genau diese Einfachheit ist die Quelle seiner Stärke
- Ähnlich wie Cursors Background Agent oder die verwaltete Web-UI von Codex, aber deutlich stärker anpassbar
- Volle Kontrolle über Container und Umgebung → besserer Datenzugang
- Deutlich stärkere Sandbox- und Audit-Kontrollen als bei anderen Produkten
- Unterstützt alle fortgeschrittenen Funktionen wie Hooks und MCP
-
Anwendungsfälle
- Ein Custom-„PR von überall“-Tool bauen
- PRs können aus Slack, Jira oder sogar aus CloudWatch-Benachrichtigungen ausgelöst werden
- GHA liefert nach Bugfix oder Feature-Erweiterung einen vollständig getesteten PR zurück
- Datengetriebenes Flywheel
- GHA-Logs = vollständige Agenten-Logs
- Logs auf Unternehmensebene regelmäßig prüfen: gemeinsame Fehler, Bash-Fehler und uneinheitliche Engineering-Praktiken entdecken
- Flywheel: Bug → Verbesserung von CLAUDE.md/CLI → besserer Agent
$ query-claude-gha-logs --since 5d | claude -p "see what the other claudes were getting stuck on and fix it, then put up a PR"
settings.json
- Bestimmte Konfigurationen sind sowohl für Hobby- als auch für Arbeitsprojekte essenziell
HTTPS_PROXY/HTTP_PROXY: für Debugging
- Durch Inspektion des Roh-Traffics genau sehen, welche Prompts Claude sendet
- Für Background Agents ein starkes Werkzeug für fein granularen Netzwerk-Sandboxing
MCP_TOOL_TIMEOUT/BASH_MAX_TIMEOUT_MS: Werte erhöhen
- Es werden lieber lange und komplexe Befehle ausgeführt; die Standard-Timeouts sind oft zu konservativ
- Unklar, ob das nach Bash-Background-Jobs noch nötig ist, aber zur Sicherheit beibehalten
ANTHROPIC_API_KEY: bei der Arbeit einen Enterprise-API-Key verwenden (apiKeyHelper dafür nutzen)
- Wechsel von einer Lizenzierung „pro Sitz“ zu nutzungsbasierter Preisgestaltung (ein deutlich besseres Modell für diese Arbeitsweise)
- Berücksichtigt die enormen Unterschiede im Entwicklerverbrauch (zwischen Engineers wurde ein Unterschied von 1:100 festgestellt)
- Engineers können mit einem einzigen Enterprise-Konto auch mit Nicht-Claude-Code-LLM-Skripten experimentieren
"permissions": regelmäßig selbst prüfen, welche Befehle Claude automatisch ausführen darf
Abschluss
- Viel Stoff, aber hoffentlich nützlich
- Wer CLI-basierte Agenten wie Claude Code oder Codex CLI noch nicht nutzt, sollte damit anfangen
- Es gibt kaum gute Anleitungen zu diesen erweiterten Funktionen, und die einzige Möglichkeit zu lernen ist, direkt einzusteigen
2 Kommentare
Hacker-News-Kommentare
Wir halten die Datei zur Kompatibilität mit anderen AI-IDEs mit AGENTS.md synchron.
Bei näherer Recherche stellte sich heraus, dass die von Anthropic empfohlene Vorgehensweise darin besteht, in die Datei
CLAUDE.mdnur die eine Zeile@AGENTS.mdzu schreiben und den eigentlichen Inhalt in AGENTS.md abzulegen.Zugehörige Dokumentation: Claude Code Best Practices
CLAUDE.mdin AGENTS.md umbenennen, um den Standard einzuhalten.CLAUDE.md, und das funktioniert gut.Mir gefällt dieser Beitrag über MCP wirklich sehr.
Die Sichtweise, dass „MCP kein komplexes API sein sollte, sondern ein schlankes Gateway, das Authentifizierung, Networking und Sicherheitsgrenzen verwaltet und sich ansonsten heraushält“, finde ich gut.
Zugehöriger Beitrag
Trotzdem nutze ich MCP fast nie. Es wäre mir lieber, wenn man sich auf den Bereich Authentifizierung konzentrieren würde.
Referenzlink: X-Post
Etwas schade, dass ein 3000-Wörter-Artikel als „zu lang, nur zum Nachschlagen“ gilt.
Ich würde gern eine noch längere Version mit konkreten Beispielen sehen.
Ich verwende eine einfache Neustart-Routine mit
/clearund/catchup, um den Claude-Zustand zurückzusetzen und geänderte Dateien erneut einlesen zu lassen.Wahrscheinlich wird bald der Befehl
/compactdiese Rolle übernehmen./compactist es fast unbrauchbar.Selbst wenn „0% context remaining“ angezeigt wird, sind tatsächlich etwa 30 % für die Komprimierung reserviert.
Trotzdem schlägt die Komprimierung etwa in der Hälfte der Fälle fehl oder läuft in API-Limits.
Es ist auch gut, Claude Code zu verwenden, um die eigenen Einstellungen zu verbessern.
Ich empfehle, in den Plan-Modus zu wechseln und den folgenden Prompt zu verwenden:
„Lies dieses Dokument (How I use every Claude Code feature) und sag mir, wie ich meine Claude-Code-Einstellungen verbessern kann.“
Ich habe die Pflege von CLAUDE.md aufgegeben, weil Claude selbst einfache Anweisungen daraus nicht zuverlässig befolgt.
Zum Beispiel habe ich vorgegeben, generierte Skripte
<foo>.aigen.tszu nennen, aber das wird in der Hälfte der Fälle ignoriert.Deshalb umgehe ich das Problem, indem ich den Kontext jedes Mal direkt in den Prompt schreibe.
Bin ich der Einzige mit diesem Problem?
Ich habe in mehreren Projekten ähnliche Ergebnisse erzielt.
Es hieß: „Wenn du keine CLI-basierten Agenten verwendest, solltest du es tun“, und ich frage mich, ob das wirklich besser ist als die Cursor-App.
An Cursor gefällt mir, dass man leicht einen bestimmten Codeteil auswählen und mit Cmd-L sagen kann: „Bitte repariere diesen Teil.“
Code-Schnipsel per CLI zu schicken wirkt etwas umständlich.
Sowohl die leichtgewichtige UX als auch die Effizienz sind besser. Claude funktioniert in CC am besten.
ghlassen sich ebenfalls ausführen.Beim Satz „Claude Code ist nicht einfach nur eine CLI, sondern ein SDK, mit dem man neue Agenten bauen kann“ hatte ich das Gefühl, das sei ein von AI geschriebener Tonfall, und das hat mich ermüdet.
Es wirkte, als würde der Leser nicht respektiert.
Dieser Artikel ist meiner Meinung nach ein gutes Beispiel, weil man merkt, dass der Autor ihn selbst gelesen und bearbeitet hat.
Wenn man dagegen AI-Ausgaben einfach unverändert hineinkopiert, ist Kritik völlig berechtigt.
Ich hatte eher das Gefühl, respektiert zu werden, und habe den Text bis zum Ende gelesen.
Diese Tools sind zwar interessant, aber ich mache mir Sorgen, dass sich die Branche wieder einmal auf die Technik selbst statt auf den Kunden konzentriert.
(Das erinnert mich an Paul Grahams Essay „Top idea in your mind“.)
Wenn ein Produkt schnell und billig gebaut wird, aber voller Bugs ist, bringt das gar nichts.
Bei AI ist es ähnlich: CEOs sehen darin oft nur ein Mittel zum Personalabbau, doch die Technik ist noch nicht auf einem Niveau, das Kunden echten Nutzen bringt.
AI-Chatbots machen Kunden nur noch genervter.
Die Entwicklungsgeschwindigkeit von Claude Code ist erstaunlich hoch.
Es wird laufend besser, so sehr, dass man jede Woche etwas Neues lernen muss.
Wenn es die Funktionszahl erhöhen könnte, ohne mein M4 Mac (64 GB RAM) langsamer zu machen, dann wäre das echte Magie.
Ist gut, aber ..