Software nach AI: Der Beginn des Harness-Zeitalters
(tomtunguz.com)- Das Ende des Software-Zeitalters ist der Beginn des Harness-Zeitalters, und SaaS, das mit festen Workflows und verwalteten Datenbanken betrieben wurde, wird derzeit durch intelligente AI ersetzt
- AI ist mächtig, aber wie ein Wildpferd noch ungezähmt; um ihre Kraft zu nutzen, ist systematische Kontrolle (domestication) erforderlich
- Das Harness für AI-Agenten wird durch 7 zentrale Komponenten definiert, die ein zentrales LLM umgeben; jede davon bestimmt Zuverlässigkeit und Performance auf Produktionsniveau
- In einer Ära, in der alle Unternehmen Zugang zu denselben Modellen haben, gewinnt nicht das Modell selbst, sondern die Seite, die das Harness besser entwirft und betreibt (best rider)
- Tausende voneinander getrennte Märkte, die von den großen Labs nicht priorisiert werden, bleiben eine Chance für Startups
Die Bedeutung des Harness-Zeitalters
- AI ersetzt die auf festen Workflows basierende SaaS und verwaltete Datenbanken durch Intelligenz (intelligence) und definiert damit das Software-Paradigma neu
- AI wird mit einem Mustang verglichen: kraftvoll, aber rau und in dieser Form nicht direkt einsetzbar; dieses Zähmen ist das Harness
- Das Wesen dieser Zähmung ist eine Architektur, bei der das LLM im Zentrum steht und sieben Komponenten radial darum angeordnet sind
Die 7 Komponenten des Harness für AI-Agenten
-
1. Context & Memory (Kontext und Speicher)
- Universelle Modelle benötigen maßgeschneiderte Retrieval-Systeme (bespoke retrieval) je nach Anwendungszweck; ein Kontext-Retrieval-System für Radiologen kann nicht dasselbe sein wie eines für juristische Assistenzen
- Kurzzeitgedächtnis ("Was hat der Agent vor 45 Sekunden getan?"), groß angelegte Bildsuche (Radiologie/Bilderzeugung), Keyword-Suche über Milliarden Dokumente hinweg – je nach Fall ist ein anderes System nötig
- Neben dem Retrieval liegt eine Kontext-Datenbank, die als „Rezeptbuch“ dafür dient, wie ein Unternehmen tatsächlich arbeitet
- Standard Operating Procedures (SOPs), die Menschen im Kopf mit zur Arbeit bringen, sind genau diese Rezepte
- Die anfängliche Erfassung und die Weiterentwicklung durch Veränderungen bei Menschen und Prozessen bilden den Kern der Kontext-Datenbank
-
2. Tools & Action (Tools und Aktionen)
- Tools sind das Mittel, mit dem der Agent auf die Außenwelt einwirkt; wenn die Rezepte in der Kontext-Datenbank festlegen, „was zu tun ist“, dann sind Tools die Zutaten und Instrumente, um es tatsächlich auszuführen
- Moderne Harnesses stellen Tools über eine Registry bereit, validieren die vom Modell übergebenen Argumente, dispatchen Aufrufe, leiten sensible Vorgänge durch Approval-Gates und parsen die Ergebnisse zurück in den Agenten-Loop
- MCP entwickelt sich zum connective tissue für Tool-Anbindungen
- Die Qualität eines Harnesses wird davon bestimmt, wie viele Tools sicher exponiert werden können und wie sauber mit Fehlern umgegangen wird
-
3. Orchestration & Loop (Orchestrierung und Loop)
- Der Agenten-Loop folgt der Struktur think → act → observe → repeat
- Planung, Aufgabenzerlegung, Sub-Agenten, Retries und Abbruchbedingungen definieren, wie Arbeit ausgeführt wird
- Das System sollte sich mit der Nutzung verbessern; Closed-Loop-Patterns, die aus jeder Ausführung lernen, sind ein Differenzierungsmerkmal zwischen Anbietern
-
4. State & Persistence (Zustand und Persistenz)
- In großen Enterprise-Umgebungen, in denen viele Personen das System gleichzeitig nutzen, ist Resilienz (resilient) unverzichtbar
- Wenn das Harness bei Schritt 7 eines 10-stufigen Ablaufs abstürzt, muss es bei Schritt 8 wieder aufnehmen statt von vorne zu beginnen
- Dateisysteme, Checkpoints, Session-Threads und Artifact Stores sind Mechanismen, die Arbeitsverlust verhindern
-
5. Sandbox & Compute (Sandbox und Compute)
- Jeder Agent benötigt einen isolierten Arbeitsbereich (Sandbox)
- Isolierte Unix-Workspaces, kontrollierter Netzwerk-Egress und Credentials, die außerhalb des Modells gespeichert werden, gewährleisten Sicherheit, Vertraulichkeit und Geschwindigkeit im großen Maßstab
-
6. Observability & Governance (Observability und Governance)
- „Was man nicht sehen kann, kann man nicht vertrauen“ – das Nachverfolgen jedes Schritts, das Logging jedes Tool-Calls, das Ausführen von Evals als Regressionstests und Human-in-the-Loop bei Entscheidungen mit höchstem Risiko verwandeln eine Demo in ein Produktionssystem
- Guardrails setzen Policies durch, Evals erkennen Regressionen vor den Kunden
-
7. Cost & Workflow Optimization (Kosten- und Workflow-Optimierung)
- Der siebte Punkt ist architektonisches Urteilsvermögen (architectural judgment)
- Die Unterscheidung, was deterministisch vs. nicht deterministisch verarbeitet werden sollte, die Auswahl des passenden Modells pro Schritt (State of the Art, mittelgroß, klein, Fine-Tuning) sowie die Entscheidung, ob Wissen in Skills oder im Speicher liegen sollte
Neue Wettbewerbsdynamik
- Das Ergebnis ist eine neue Wettbewerbsdynamik in Software, die nicht in jeder Kategorie gleichermaßen gilt
- Märkte, die von den Major Labs (führenden AI-Forschungslaboren) priorisiert werden, profitieren von schnellerer Umsetzung und direkter Modellkontrolle
- Darüber hinaus stehen jedoch Tausende eigenständige Märkte Startups offen
- In einer Zeit, in der alle Unternehmen dieselben Modelle nutzen können, gewinnen die „best riders“ – also diejenigen mit der stärksten Kompetenz beim Entwurf und Betrieb des Harnesses
Noch keine Kommentare.