62 Punkte von GN⁺ 2025-08-25 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Im Jahr 2025 ist es eines der besten Projekte, die ein einzelner Entwickler selbst ausprobieren kann, einen Coding-Agenten zu bauen
  • Ein Agent funktioniert allein mit 300 Zeilen Code und einer LLM-Token-Schleife und bietet damit die Chance, sich vom Konsumenten zum AI-Produzenten zu entwickeln
  • Die grundlegenden Bausteine sind Tools wie Dateien lesen, Dateien auflisten, Bash ausführen, Dateien bearbeiten und Code durchsuchen, mit denen sich echte Automatisierungsfunktionen umsetzen lassen
  • Bei der Modellauswahl eignen sich agentische Modelle wie Claude Sonnet und Kimi K2; bei Bedarf kann ein Orakel-Modell wie GPT als Tool für höherwertige Verifikation angebunden werden
  • Auch kommerzielle Produkte wie Amp, Cursor, Claude Code und GitHub Copilot basieren in der Praxis auf einer ähnlichen Struktur

Workshop-Überblick

  • Ein kostenloser Workshop von Geoffrey Huntley, der praxisnah zeigt, wie man einen Coding-Agenten selbst baut und wie er funktioniert
  • Bietet die Gelegenheit, Struktur und Prinzipien bestehender kommerzieller AI-Helfer wie Roo code, Cline, Amp, Cursor, Windsurf und OpenCode zu vergleichen und selbst nachzubauen
  • Durch die Bauerfahrung kann man über die Rolle eines bloßen AI-Nutzers hinauswachsen und sich zu einem Entwickler entwickeln, der mit AI selbst Automatisierungstools baut
  • Die Kernstruktur besteht darin, mit rund 300 Zeilen Code eine LLM-Token-Schleife zu nutzen, um Agentenfunktionen zu erzeugen
  • Für jedes Tool werden Primitive wie Lesen, Dateiliste, Ausführen, Bearbeiten und Code-Suche ergänzt; konkrete Beispiele und Code sind im GitHub-Repository veröffentlicht

Was ist ein Agent?

  • In letzter Zeit wird der Begriff „Agent“ sehr breit verwendet, doch seine tatsächliche Bedeutung und das innere Funktionsprinzip sind oft unklar
  • Da die Einstiegshürde für den Bau von Agenten sinkt, kann man über den AI-Konsumenten hinaus zu einem Produzenten werden, der Arbeitsautomatisierung aktiv vorantreibt
  • Stand 2025 ist das Prinzip hinter dem Bau von Agenten zu einem Pflichtwissen geworden, ähnlich wie grundlegende Datenbankkonzepte wie Primary Key
  • Unternehmen wie Canva empfehlen bereits im Bewerbungsprozess den Einsatz von AI, und Fähigkeiten zur AI-Automatisierung werden zu einem zentralen Einstellungskriterium
  • Wer heute zurückfällt, tut das nicht wegen AI, sondern weil er sich nicht weiterentwickelt und keine neuen Tools lernt

Das Kernprinzip von Coding-Agenten

  • Coding-Agenten bestehen lediglich aus 300 Zeilen Code und einer LLM-Token-Schleife und erfüllen ihre Aufgaben durch wiederholte Token-Eingaben
  • Das Konzept der gleichzeitigen Arbeit (concurrent work) ist wichtig
    • Beispiel: Selbst während eines Zoom-Meetings kann ein Agent parallel weiterarbeiten und so die Arbeitseffizienz deutlich steigern
  • Nicht jedes LLM ist agentisch
    • „hohe Sicherheit“ (z. B. Anthropic, OpenAI)
    • „niedrige Sicherheit“ (z. B. Grok)
    • „Orakel“ (gut für Zusammenfassungen und höheres Denken)
    • „agentisch“ (handlungsorientiert, schnelle Iteration und Tool-Aufrufe)
  • Entwickler sollten die Eigenschaften der einzelnen Modelle verstehen und je nach Zweck das passende Modell auswählen
  • Eine bedingungslose Zuteilung großer Kontextfenster verschlechtert die Leistung; man sollte bedenken: „Je weniger zugeteilt wird, desto besser das Ergebnis“
    • Zu viele registrierte MCP-Tools führen ebenfalls zu Leistungseinbußen
  • Regel: „Less is more“ → Nur die nötigen Tools und Daten sollten in den Kontext aufgenommen werden, um optimale Leistung zu erzielen

Ablauf beim Aufbau eines Coding-Agenten

  • 1. Tool-Registrierung und Function Calling

    • Man registriert im LLM zum Beispiel ein Tool zur Wetterabfrage, sodass das LLM in passenden Situationen im Format eines Function Calls darauf reagieren kann
    • MCP (Model Context Protocol) ähnelt einem „Informationsbanner für Funktionen“; schon das Registrieren der Funktionsbeschreibung kann automatische Aufrufe ermöglichen
  • 2. Kernfunktionen der einzelnen primitiven Tools

    • Datei lesen (ReadFile): Liest beim Übergeben eines Pfads den Dateiinhalt als Kontext ein
    • Dateien auflisten (ListFiles): Liefert eine Liste von Dateien und Ordnern in einem Verzeichnis
    • Befehle ausführen (Bash): Das LLM führt Shell-Befehle des Systems aus und gibt die Ergebnisse zurück
    • Datei bearbeiten (Edit): Automatisiert das Erstellen oder Ändern einer angegebenen Datei
    • Code durchsuchen (CodeSearch): Durchsucht die gesamte Codebasis schnell anhand von Mustern, Keywords oder Funktionsnamen (mit ripgrep)
  • 3. Beispiele und Ergebnisfluss

    • Durch die Integration der einzelnen Tools in das LLM lässt sich allein mit natürlichen Sprachprompts zusammenhängende Arbeit automatisieren, etwa FizzBuzz-Code erzeugen und Ausführung prüfen oder Verzeichnisse durchsuchen und Inhalte analysieren
    • Die Tool-Funktionen werden passend zu Benutzereingaben oder Szenarien innerhalb einer Schleife nacheinander aufgerufen und liefern wiederholt Ergebnisse zurück
    • Die zentrale Abfolge im Agenten lautet: Benutzereingabe → Entscheidung über Tool-Aufruf → Tool-Ausführung → Zuweisung des Ergebnisses zum Kontext → Wiederholung

Erweiterbarkeit und Open Source

  • Derzeit arbeiten die meisten Coding-Agenten auf Basis bestehender Open-Source-Tools wie ripgrep
  • Auf GitHub gibt es einfache, aber leistungsstarke Agentenprojekte wie SST Open Code und mini-swe-agent, die in nur 100 Zeilen umgesetzt sind und als Referenz für Leistung und Struktur dienen können
  • Entwicklern wird empfohlen, statt nur Produkte zu vergleichen die Prinzipien durch eigenes Bauen zu verstehen und anzuwenden
  • Bei der Anwendung auf reale Arbeit und Automatisierung wird das Erstellen eigener Agenten und ihre Verbreitung im Unternehmen zu einem Wettbewerbsvorteil

Fazit und Implikationen

  • Coding-Agenten sind keine komplexe Technik, sondern bestehen aus einer einfachen Schleifenstruktur und einer Kombination von Tools
  • Der Schlüssel zum Bau von Coding-Agenten liegt im Verständnis der Struktur und der Fähigkeit zur schnellen Umsetzung; durch eigene Bauerfahrung kann man aktiv auf Veränderungen in der AI-Technologie reagieren
  • Wichtiger als AI selbst ist zum jetzigen Zeitpunkt kontinuierliche Selbstentwicklung und die Investition in die Fähigkeit, eigene Tools zu bauen als Strategie für persönliches Wachstum
  • „Nicht AI nimmt dir die Arbeit weg, sondern deine Kollegen, die mit Agenten bewaffnet automatisieren und schneller arbeiten

Noch keine Kommentare.

Noch keine Kommentare.