- Im Verlauf von Projekten zeigt sich immer wieder eine Entwicklung vom einfachen Schreiben von Skripten hin zum Aufbau autonomer AI-Agenten
- Sobald den in Entwicklung befindlichen Tools Zugriff auf Werkzeuge gewährt wird, verwandelt sich ein einfaches dialogorientiertes Modell in einen Agenten, der planen, ausführen und iterieren kann
- Klassifikatoren oder auf Bedingungen basierende Logik werden letztlich durch Agentenstrukturen ersetzt, und eine einfache Struktur rund um vom Modell ausgewählte Tool-Aufrufe ist flexibler und leistungsfähiger
- Die Rolle des Menschen verschiebt sich von Human-in-the-Loop zu Human-on-the-Loop, und das Setzen von Zielen und Guardrails wird zur Kernaufgabe
- Wichtiger als Code-Komplexität werden Vertrauen und das Management von Urteilen, und Agenten etablieren sich als Systeme, die gemeinsam mit Entwicklern wachsen
Von einfachen Skripten zur Konvergenz auf Agenten
- Die meisten AI-Projekte, die im Laufe des Jahres 2025 umgesetzt wurden, endeten letztlich in einer Agentenform
- Ein einfaches Skript mit Eingabe-, Verarbeitungs- und Ausgabestruktur entwickelt sich durch wiederholte Schleifen, Tool-Arrays und JSON-Parsing zu einem Agenten weiter
- Die hier zugrunde gelegte Definition eines Agenten: ein Modell, das in einer Schleife ausgeführt wird und Zugriff auf Werkzeuge hat
- Mit anderen Worten: Wenn genügend Zeit gegeben ist, konvergiert jedes AI-Projekt letztlich zu einem Agenten
Die Schwerkraft Richtung Autonomie
- Über einfache Automatisierungsfunktionen hinaus bewegt sich Software in eine Phase, in der sie wie ein „digitaler Praktikant“ selbst entscheidet und handelt
- Gemini Scribe war anfangs nur ein einfacher Chat-Plugin für Obsidian, doch nachdem Zugriff auf das Tool
read_file erlaubt wurde, übernahm es Kontextmanagement und Ausführung eigenständig
- Nutzer verwalten die Eingaben des Modells nicht mehr manuell, sondern geben nur noch Anweisungen auf Befehlsebene wie „Lies das Besprechungsprotokoll und fasse es zusammen“
- Diese Veränderung bedeutet einen Übergang von Konversation zu Delegation und entwickelt sich zu einer Struktur, in der der Agent Planung, Ausführung und Iteration übernimmt
Von Skripten zu Sudoers
- Auch bei der Entwicklung von Gemini CLI erweiterte sich das Modell durch die Nutzung eines Tools zur Befehlsausführung über einen simplen Codegenerator hinaus zu einem autonomen Ausführer
- Das Modell bildete eine Schleife, in der es Tests ausführt, Fehler erkennt, Korrekturen vornimmt und anschließend erneut ausführt
- In diesem Prozess traten Sicherheits- und Vertrauensfragen in den Vordergrund, sodass – ähnlich wie bei der Datei
sudoers – ein Richtliniensystem zur Rechteabgrenzung notwendig wurde
- Ein einfaches Skript braucht keine Policy Engine, aber ein Agent benötigt zwingend Guardrails, um Fehlurteile zu verhindern
Der Agent, der ein Klassifikator sein wollte
- Im Podcast-RAG-Projekt wurde ein AI-Klassifikator gebaut, der je nach Nutzeranfrage das Suchziel klassifiziert, doch dabei wurden Grenzen sichtbar
- Die Klassifikationslogik spiegelte die Nutzerintention nicht vollständig wider und schränkte Entscheidungen, die das Modell eigentlich bereits gut treffen konnte, durch Code ein
- Die Lösung bestand darin, den Klassifikator zu entfernen und dem Agenten die beiden Tools
search_descriptions und search_episodes bereitzustellen
- Der Agent wählt die Tools je nach Situation aus oder verwendet sie parallel und führt so eine flexiblere Suche aus
- Auch in Gemini Scribe wurde komplexe Logik zur Kontextvorhersage entfernt und zu einer Struktur mit Tool-Aufrufen vereinfacht, die bei Bedarf Dateien liest
- Vorgeschlagen wird damit ein Entwicklungskriterium: „Wenn du per if/else entscheidest, was die AI tun soll, baust du bereits einen Agenten“
Der Wechsel zu Human-on-the-Loop
- Die Rolle des Menschen verschiebt sich von einer Struktur, in der jeder Schritt genehmigt wird, hin zu einer Aufsichtsrolle, die nur Ziele und Grenzen festlegt
- Da Agenten Aufgaben ohne ständige menschliche Eingriffe ausführen, ist eine klare Definition von Zielen, Grenzen und Ausnahmebehandlung zwingend erforderlich
- Ohne geeignete Guardrails besteht das Risiko, dass ein Agent in Warteschleifen auf Eingaben oder in unproduktive Pfade gerät
- Der Mensch verwaltet die Richtung des Systems nicht mehr als Ausführender, sondern als Aufseher und Setzer von Grenzen
Komplexität akzeptieren
- Der Aufbau von Agenten ist nicht so schwierig, wie es auf den ersten Blick scheint, und kann vielmehr durch das Entfernen von bedingten Verzweigungen und Ausnahmebehandlungslogik vereinfacht werden
- Da das Modell je nach Situation urteilt, wird vorab fest verdrahtete Vorhersagelogik überflüssig
- Die eigentliche Komplexität liegt nicht im Code, sondern in Vertrauen und der Delegation von Urteilen
- Entwickler sollten sich weniger auf Syntaxfehler konzentrieren als auf ein Design, das Fehlurteile verhindert
- Anders als feste Skripte sind Agenten Systeme, die sich entsprechend den Anfragen der Nutzer weiterentwickeln und bessere Vorgehensweisen finden
- Wenn du zu einem einfachen Skript Tool-Definitionen hinzufügen möchtest, hast du die Phase des Agentenbaus bereits erreicht
Noch keine Kommentare.