- Anhand der Entwicklungserfahrung mit dem KI-Programmierassistenten Sketch wird die einfache Implementierung einer Schleifenstruktur, die LLMs mit Tool-Nutzung kombiniert, hervorgehoben
- Mit nur 9 Zeilen Schleifencode lösen moderne LLMs wie Claude 3.7 Sonnet reale Probleme schnell und praktisch nutzbar
- Schon mit nur einem universellen Tool wie bash lässt sich ein großer Teil repetitiver und kniffliger Aufgaben von Entwicklerinnen und Entwicklern automatisieren
- Über die reine Problemlösung hinaus kann durch die Anbindung zusätzlicher Tools die Qualität und Wiederholungsgeschwindigkeit bei Textbearbeitung oder spezialisierten Aufgaben erhöht werden
- Es zeichnet sich ein Trend ab, dass immer mehr maßgeschneiderte LLM-Agenten-Schleifen in die tägliche Automatisierung von Entwicklerinnen und Entwicklern Einzug halten
Einleitung: Entwicklungserfahrung und das Sketch-Projekt
- Philip Zeligger und seine Kolleginnen und Kollegen waren bei der Entwicklung des KI-basierten Programmierhilfswerkzeugs Sketch überrascht, wie effizient eine einfache Agenten-Schleifenstruktur, die LLMs mit Tool-Nutzung verbindet, sein kann
- Die Kernstruktur besteht aus nur 9 Zeilen Schleifencode, die den System-Prompt, den Gesprächsverlauf und die neueste Nachricht an die LLM-API übergeben
- Das LLM erzeugt eine Ausgabe und gibt bei Bedarf
tool_calls (Anfragen zum Aufruf von Tools) zurück
Integration von LLMs und Tool-Nutzung
- „Tool-Nutzung (tool use)“ bedeutet, dass ein LLM eine Ausgabe entsprechend einem vordefinierten Schema zurückgibt und über den System-Prompt sowie Tool-Beschreibungsprompts Zugriff auf universelle Tools wie
bash erhält
- Moderne LLMs (z. B. Claude 3.7 Sonnet) automatisieren mit nur einem einzigen universellen Tool unterschiedlichste Probleme schnell; manche lassen sich sogar in einem einzigen Durchlauf („one shot“) lösen
- Früher musste man komplexe
git-Befehle heraussuchen, einfügen und Merge-Arbeiten manuell erledigen, heute kann man Sketch einfach darum bitten und das Problem direkt lösen
- Auch zahlreiche Type-Check-Fehler nach Typänderungen wurden von Sketch erstmals automatisch behoben
- Die Agenten-Schleife arbeitet kontinuierlich und adaptiv: Fehlen Tools, werden sie automatisch installiert, und auch auf Unterschiede bei Kommandooptionen wird passend reagiert
- Während der Nutzung macht das LLM mitunter unerwartete Vorschläge wie „Tests überspringen“, wenn Tests fehlschlagen, insgesamt verbessert sich jedoch die Qualität der Arbeitsautomatisierung
Vielfalt und Spezialisierung von Tools
- Sketch hat die Erfahrung gemacht, dass zusätzliche Tools neben
bash (z. B. Textbearbeitungstools) die Qualität der Arbeit erhöhen und den Entwicklungs-Workflow noch effizienter machen
- Für ein LLM ist es schwieriger als erwartet, Text mit
sed und ähnlichen Werkzeugen präzise zu bearbeiten; Tools im Stil visueller Editoren sind dabei spürbar überlegen
Zukunftsausblick und Veränderungen im Workflow
- Es ist zu erwarten, dass Agenten-Schleifenstrukturen zunehmend für repetitive Aufgaben im Entwickleralltag eingesetzt werden, die mit bestehenden universellen Automatisierungstools nur schwer zu bewältigen waren
- Ein Beispiel sind lästige und wiederkehrende Aufgaben wie die Analyse von Korrelationen zwischen Stack Traces und Git-Commits, bei denen LLMs schnell eine erste Bearbeitung übernehmen können
- Künftig dürften noch mehr maßgeschneiderte, einmalige LLM-Agenten-Schleifen etwa im
bin/-Verzeichnis von Entwicklerinnen und Entwicklern genutzt werden
- Nutzerinnen und Nutzer können mit einem gewünschten Bearer Token in ihrer eigenen Umgebung leicht damit experimentieren
Weiterführende Links
1 Kommentare
Hacker-News-Kommentare
?utm_source=hn&utm_medium=browseranhängen sollte// omitted for brevityabgeschnitten, also unbrauchbar. Da habe ich aufgegeben. Ich frage mich, ob Agenten dieses Problem lösen. Im Moment habe ich den Eindruck, dass diese Erfahrung komplett kaputt ist, und in so einem Zustand Bash-Zugriff zu geben erscheint mir viel zu riskant