- Im Jahr 2025 ist es eines der besten Projekte, die ein einzelner Entwickler selbst ausprobieren kann, einen Coding-Agenten zu bauen
- Ein Agent funktioniert allein mit 300 Zeilen Code und einer LLM-Token-Schleife und bietet damit die Chance, sich vom Konsumenten zum AI-Produzenten zu entwickeln
- Die grundlegenden Bausteine sind Tools wie Dateien lesen, Dateien auflisten, Bash ausführen, Dateien bearbeiten und Code durchsuchen, mit denen sich echte Automatisierungsfunktionen umsetzen lassen
- Bei der Modellauswahl eignen sich agentische Modelle wie Claude Sonnet und Kimi K2; bei Bedarf kann ein Orakel-Modell wie GPT als Tool für höherwertige Verifikation angebunden werden
- Auch kommerzielle Produkte wie Amp, Cursor, Claude Code und GitHub Copilot basieren in der Praxis auf einer ähnlichen Struktur
Workshop-Überblick
- Ein kostenloser Workshop von Geoffrey Huntley, der praxisnah zeigt, wie man einen Coding-Agenten selbst baut und wie er funktioniert
- Bietet die Gelegenheit, Struktur und Prinzipien bestehender kommerzieller AI-Helfer wie Roo code, Cline, Amp, Cursor, Windsurf und OpenCode zu vergleichen und selbst nachzubauen
- Durch die Bauerfahrung kann man über die Rolle eines bloßen AI-Nutzers hinauswachsen und sich zu einem Entwickler entwickeln, der mit AI selbst Automatisierungstools baut
- Die Kernstruktur besteht darin, mit rund 300 Zeilen Code eine LLM-Token-Schleife zu nutzen, um Agentenfunktionen zu erzeugen
- Für jedes Tool werden Primitive wie Lesen, Dateiliste, Ausführen, Bearbeiten und Code-Suche ergänzt; konkrete Beispiele und Code sind im GitHub-Repository veröffentlicht
Was ist ein Agent?
- In letzter Zeit wird der Begriff „Agent“ sehr breit verwendet, doch seine tatsächliche Bedeutung und das innere Funktionsprinzip sind oft unklar
- Da die Einstiegshürde für den Bau von Agenten sinkt, kann man über den AI-Konsumenten hinaus zu einem Produzenten werden, der Arbeitsautomatisierung aktiv vorantreibt
- Stand 2025 ist das Prinzip hinter dem Bau von Agenten zu einem Pflichtwissen geworden, ähnlich wie grundlegende Datenbankkonzepte wie Primary Key
- Unternehmen wie Canva empfehlen bereits im Bewerbungsprozess den Einsatz von AI, und Fähigkeiten zur AI-Automatisierung werden zu einem zentralen Einstellungskriterium
- Wer heute zurückfällt, tut das nicht wegen AI, sondern weil er sich nicht weiterentwickelt und keine neuen Tools lernt
Das Kernprinzip von Coding-Agenten
- Coding-Agenten bestehen lediglich aus 300 Zeilen Code und einer LLM-Token-Schleife und erfüllen ihre Aufgaben durch wiederholte Token-Eingaben
- Das Konzept der gleichzeitigen Arbeit (concurrent work) ist wichtig
- Beispiel: Selbst während eines Zoom-Meetings kann ein Agent parallel weiterarbeiten und so die Arbeitseffizienz deutlich steigern
- Nicht jedes LLM ist agentisch
- „hohe Sicherheit“ (z. B. Anthropic, OpenAI)
- „niedrige Sicherheit“ (z. B. Grok)
- „Orakel“ (gut für Zusammenfassungen und höheres Denken)
- „agentisch“ (handlungsorientiert, schnelle Iteration und Tool-Aufrufe)
- Entwickler sollten die Eigenschaften der einzelnen Modelle verstehen und je nach Zweck das passende Modell auswählen
- Eine bedingungslose Zuteilung großer Kontextfenster verschlechtert die Leistung; man sollte bedenken: „Je weniger zugeteilt wird, desto besser das Ergebnis“
- Zu viele registrierte MCP-Tools führen ebenfalls zu Leistungseinbußen
- Regel: „Less is more“ → Nur die nötigen Tools und Daten sollten in den Kontext aufgenommen werden, um optimale Leistung zu erzielen
Ablauf beim Aufbau eines Coding-Agenten
-
1. Tool-Registrierung und Function Calling
- Man registriert im LLM zum Beispiel ein Tool zur Wetterabfrage, sodass das LLM in passenden Situationen im Format eines Function Calls darauf reagieren kann
- MCP (Model Context Protocol) ähnelt einem „Informationsbanner für Funktionen“; schon das Registrieren der Funktionsbeschreibung kann automatische Aufrufe ermöglichen
-
2. Kernfunktionen der einzelnen primitiven Tools
- Datei lesen (ReadFile): Liest beim Übergeben eines Pfads den Dateiinhalt als Kontext ein
- Dateien auflisten (ListFiles): Liefert eine Liste von Dateien und Ordnern in einem Verzeichnis
- Befehle ausführen (Bash): Das LLM führt Shell-Befehle des Systems aus und gibt die Ergebnisse zurück
- Datei bearbeiten (Edit): Automatisiert das Erstellen oder Ändern einer angegebenen Datei
- Code durchsuchen (CodeSearch): Durchsucht die gesamte Codebasis schnell anhand von Mustern, Keywords oder Funktionsnamen (mit ripgrep)
-
3. Beispiele und Ergebnisfluss
- Durch die Integration der einzelnen Tools in das LLM lässt sich allein mit natürlichen Sprachprompts zusammenhängende Arbeit automatisieren, etwa FizzBuzz-Code erzeugen und Ausführung prüfen oder Verzeichnisse durchsuchen und Inhalte analysieren
- Die Tool-Funktionen werden passend zu Benutzereingaben oder Szenarien innerhalb einer Schleife nacheinander aufgerufen und liefern wiederholt Ergebnisse zurück
- Die zentrale Abfolge im Agenten lautet: Benutzereingabe → Entscheidung über Tool-Aufruf → Tool-Ausführung → Zuweisung des Ergebnisses zum Kontext → Wiederholung
Erweiterbarkeit und Open Source
- Derzeit arbeiten die meisten Coding-Agenten auf Basis bestehender Open-Source-Tools wie ripgrep
- Auf GitHub gibt es einfache, aber leistungsstarke Agentenprojekte wie SST Open Code und mini-swe-agent, die in nur 100 Zeilen umgesetzt sind und als Referenz für Leistung und Struktur dienen können
- Entwicklern wird empfohlen, statt nur Produkte zu vergleichen die Prinzipien durch eigenes Bauen zu verstehen und anzuwenden
- Bei der Anwendung auf reale Arbeit und Automatisierung wird das Erstellen eigener Agenten und ihre Verbreitung im Unternehmen zu einem Wettbewerbsvorteil
Fazit und Implikationen
- Coding-Agenten sind keine komplexe Technik, sondern bestehen aus einer einfachen Schleifenstruktur und einer Kombination von Tools
- Der Schlüssel zum Bau von Coding-Agenten liegt im Verständnis der Struktur und der Fähigkeit zur schnellen Umsetzung; durch eigene Bauerfahrung kann man aktiv auf Veränderungen in der AI-Technologie reagieren
- Wichtiger als AI selbst ist zum jetzigen Zeitpunkt kontinuierliche Selbstentwicklung und die Investition in die Fähigkeit, eigene Tools zu bauen als Strategie für persönliches Wachstum
- „Nicht AI nimmt dir die Arbeit weg, sondern deine Kollegen, die mit Agenten bewaffnet automatisieren und schneller arbeiten“
Noch keine Kommentare.