10 Punkte von GN⁺ 2026-01-16 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Im Verlauf von Projekten zeigt sich immer wieder eine Entwicklung vom einfachen Schreiben von Skripten hin zum Aufbau autonomer AI-Agenten
  • Sobald den in Entwicklung befindlichen Tools Zugriff auf Werkzeuge gewährt wird, verwandelt sich ein einfaches dialogorientiertes Modell in einen Agenten, der planen, ausführen und iterieren kann
  • Klassifikatoren oder auf Bedingungen basierende Logik werden letztlich durch Agentenstrukturen ersetzt, und eine einfache Struktur rund um vom Modell ausgewählte Tool-Aufrufe ist flexibler und leistungsfähiger
  • Die Rolle des Menschen verschiebt sich von Human-in-the-Loop zu Human-on-the-Loop, und das Setzen von Zielen und Guardrails wird zur Kernaufgabe
  • Wichtiger als Code-Komplexität werden Vertrauen und das Management von Urteilen, und Agenten etablieren sich als Systeme, die gemeinsam mit Entwicklern wachsen

Von einfachen Skripten zur Konvergenz auf Agenten

  • Die meisten AI-Projekte, die im Laufe des Jahres 2025 umgesetzt wurden, endeten letztlich in einer Agentenform
  • Ein einfaches Skript mit Eingabe-, Verarbeitungs- und Ausgabestruktur entwickelt sich durch wiederholte Schleifen, Tool-Arrays und JSON-Parsing zu einem Agenten weiter
  • Die hier zugrunde gelegte Definition eines Agenten: ein Modell, das in einer Schleife ausgeführt wird und Zugriff auf Werkzeuge hat
  • Mit anderen Worten: Wenn genügend Zeit gegeben ist, konvergiert jedes AI-Projekt letztlich zu einem Agenten

Die Schwerkraft Richtung Autonomie

  • Über einfache Automatisierungsfunktionen hinaus bewegt sich Software in eine Phase, in der sie wie ein „digitaler Praktikant“ selbst entscheidet und handelt
    • Gemini Scribe war anfangs nur ein einfacher Chat-Plugin für Obsidian, doch nachdem Zugriff auf das Tool read_file erlaubt wurde, übernahm es Kontextmanagement und Ausführung eigenständig
    • Nutzer verwalten die Eingaben des Modells nicht mehr manuell, sondern geben nur noch Anweisungen auf Befehlsebene wie „Lies das Besprechungsprotokoll und fasse es zusammen“
  • Diese Veränderung bedeutet einen Übergang von Konversation zu Delegation und entwickelt sich zu einer Struktur, in der der Agent Planung, Ausführung und Iteration übernimmt

Von Skripten zu Sudoers

  • Auch bei der Entwicklung von Gemini CLI erweiterte sich das Modell durch die Nutzung eines Tools zur Befehlsausführung über einen simplen Codegenerator hinaus zu einem autonomen Ausführer
    • Das Modell bildete eine Schleife, in der es Tests ausführt, Fehler erkennt, Korrekturen vornimmt und anschließend erneut ausführt
  • In diesem Prozess traten Sicherheits- und Vertrauensfragen in den Vordergrund, sodass – ähnlich wie bei der Datei sudoers – ein Richtliniensystem zur Rechteabgrenzung notwendig wurde
    • Ein einfaches Skript braucht keine Policy Engine, aber ein Agent benötigt zwingend Guardrails, um Fehlurteile zu verhindern

Der Agent, der ein Klassifikator sein wollte

  • Im Podcast-RAG-Projekt wurde ein AI-Klassifikator gebaut, der je nach Nutzeranfrage das Suchziel klassifiziert, doch dabei wurden Grenzen sichtbar
    • Die Klassifikationslogik spiegelte die Nutzerintention nicht vollständig wider und schränkte Entscheidungen, die das Modell eigentlich bereits gut treffen konnte, durch Code ein
  • Die Lösung bestand darin, den Klassifikator zu entfernen und dem Agenten die beiden Tools search_descriptions und search_episodes bereitzustellen
    • Der Agent wählt die Tools je nach Situation aus oder verwendet sie parallel und führt so eine flexiblere Suche aus
  • Auch in Gemini Scribe wurde komplexe Logik zur Kontextvorhersage entfernt und zu einer Struktur mit Tool-Aufrufen vereinfacht, die bei Bedarf Dateien liest
  • Vorgeschlagen wird damit ein Entwicklungskriterium: „Wenn du per if/else entscheidest, was die AI tun soll, baust du bereits einen Agenten“

Der Wechsel zu Human-on-the-Loop

  • Die Rolle des Menschen verschiebt sich von einer Struktur, in der jeder Schritt genehmigt wird, hin zu einer Aufsichtsrolle, die nur Ziele und Grenzen festlegt
    • Da Agenten Aufgaben ohne ständige menschliche Eingriffe ausführen, ist eine klare Definition von Zielen, Grenzen und Ausnahmebehandlung zwingend erforderlich
  • Ohne geeignete Guardrails besteht das Risiko, dass ein Agent in Warteschleifen auf Eingaben oder in unproduktive Pfade gerät
  • Der Mensch verwaltet die Richtung des Systems nicht mehr als Ausführender, sondern als Aufseher und Setzer von Grenzen

Komplexität akzeptieren

  • Der Aufbau von Agenten ist nicht so schwierig, wie es auf den ersten Blick scheint, und kann vielmehr durch das Entfernen von bedingten Verzweigungen und Ausnahmebehandlungslogik vereinfacht werden
    • Da das Modell je nach Situation urteilt, wird vorab fest verdrahtete Vorhersagelogik überflüssig
  • Die eigentliche Komplexität liegt nicht im Code, sondern in Vertrauen und der Delegation von Urteilen
    • Entwickler sollten sich weniger auf Syntaxfehler konzentrieren als auf ein Design, das Fehlurteile verhindert
  • Anders als feste Skripte sind Agenten Systeme, die sich entsprechend den Anfragen der Nutzer weiterentwickeln und bessere Vorgehensweisen finden
  • Wenn du zu einem einfachen Skript Tool-Definitionen hinzufügen möchtest, hast du die Phase des Agentenbaus bereits erreicht

Noch keine Kommentare.

Noch keine Kommentare.