4 Punkte von GN⁺ 2 시간 전 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Das Ende des Software-Zeitalters ist der Beginn des Harness-Zeitalters, und SaaS, das mit festen Workflows und verwalteten Datenbanken betrieben wurde, wird derzeit durch intelligente AI ersetzt
  • AI ist mächtig, aber wie ein Wildpferd noch ungezähmt; um ihre Kraft zu nutzen, ist systematische Kontrolle (domestication) erforderlich
  • Das Harness für AI-Agenten wird durch 7 zentrale Komponenten definiert, die ein zentrales LLM umgeben; jede davon bestimmt Zuverlässigkeit und Performance auf Produktionsniveau
  • In einer Ära, in der alle Unternehmen Zugang zu denselben Modellen haben, gewinnt nicht das Modell selbst, sondern die Seite, die das Harness besser entwirft und betreibt (best rider)
  • Tausende voneinander getrennte Märkte, die von den großen Labs nicht priorisiert werden, bleiben eine Chance für Startups

Die Bedeutung des Harness-Zeitalters

  • AI ersetzt die auf festen Workflows basierende SaaS und verwaltete Datenbanken durch Intelligenz (intelligence) und definiert damit das Software-Paradigma neu
  • AI wird mit einem Mustang verglichen: kraftvoll, aber rau und in dieser Form nicht direkt einsetzbar; dieses Zähmen ist das Harness
  • Das Wesen dieser Zähmung ist eine Architektur, bei der das LLM im Zentrum steht und sieben Komponenten radial darum angeordnet sind

Die 7 Komponenten des Harness für AI-Agenten

  • 1. Context & Memory (Kontext und Speicher)

    • Universelle Modelle benötigen maßgeschneiderte Retrieval-Systeme (bespoke retrieval) je nach Anwendungszweck; ein Kontext-Retrieval-System für Radiologen kann nicht dasselbe sein wie eines für juristische Assistenzen
    • Kurzzeitgedächtnis ("Was hat der Agent vor 45 Sekunden getan?"), groß angelegte Bildsuche (Radiologie/Bilderzeugung), Keyword-Suche über Milliarden Dokumente hinweg – je nach Fall ist ein anderes System nötig
    • Neben dem Retrieval liegt eine Kontext-Datenbank, die als „Rezeptbuch“ dafür dient, wie ein Unternehmen tatsächlich arbeitet
      • Standard Operating Procedures (SOPs), die Menschen im Kopf mit zur Arbeit bringen, sind genau diese Rezepte
      • Die anfängliche Erfassung und die Weiterentwicklung durch Veränderungen bei Menschen und Prozessen bilden den Kern der Kontext-Datenbank
  • 2. Tools & Action (Tools und Aktionen)

    • Tools sind das Mittel, mit dem der Agent auf die Außenwelt einwirkt; wenn die Rezepte in der Kontext-Datenbank festlegen, „was zu tun ist“, dann sind Tools die Zutaten und Instrumente, um es tatsächlich auszuführen
    • Moderne Harnesses stellen Tools über eine Registry bereit, validieren die vom Modell übergebenen Argumente, dispatchen Aufrufe, leiten sensible Vorgänge durch Approval-Gates und parsen die Ergebnisse zurück in den Agenten-Loop
    • MCP entwickelt sich zum connective tissue für Tool-Anbindungen
    • Die Qualität eines Harnesses wird davon bestimmt, wie viele Tools sicher exponiert werden können und wie sauber mit Fehlern umgegangen wird
  • 3. Orchestration & Loop (Orchestrierung und Loop)

    • Der Agenten-Loop folgt der Struktur think → act → observe → repeat
    • Planung, Aufgabenzerlegung, Sub-Agenten, Retries und Abbruchbedingungen definieren, wie Arbeit ausgeführt wird
    • Das System sollte sich mit der Nutzung verbessern; Closed-Loop-Patterns, die aus jeder Ausführung lernen, sind ein Differenzierungsmerkmal zwischen Anbietern
  • 4. State & Persistence (Zustand und Persistenz)

    • In großen Enterprise-Umgebungen, in denen viele Personen das System gleichzeitig nutzen, ist Resilienz (resilient) unverzichtbar
    • Wenn das Harness bei Schritt 7 eines 10-stufigen Ablaufs abstürzt, muss es bei Schritt 8 wieder aufnehmen statt von vorne zu beginnen
    • Dateisysteme, Checkpoints, Session-Threads und Artifact Stores sind Mechanismen, die Arbeitsverlust verhindern
  • 5. Sandbox & Compute (Sandbox und Compute)

    • Jeder Agent benötigt einen isolierten Arbeitsbereich (Sandbox)
    • Isolierte Unix-Workspaces, kontrollierter Netzwerk-Egress und Credentials, die außerhalb des Modells gespeichert werden, gewährleisten Sicherheit, Vertraulichkeit und Geschwindigkeit im großen Maßstab
  • 6. Observability & Governance (Observability und Governance)

    • „Was man nicht sehen kann, kann man nicht vertrauen“ – das Nachverfolgen jedes Schritts, das Logging jedes Tool-Calls, das Ausführen von Evals als Regressionstests und Human-in-the-Loop bei Entscheidungen mit höchstem Risiko verwandeln eine Demo in ein Produktionssystem
    • Guardrails setzen Policies durch, Evals erkennen Regressionen vor den Kunden
  • 7. Cost & Workflow Optimization (Kosten- und Workflow-Optimierung)

    • Der siebte Punkt ist architektonisches Urteilsvermögen (architectural judgment)
    • Die Unterscheidung, was deterministisch vs. nicht deterministisch verarbeitet werden sollte, die Auswahl des passenden Modells pro Schritt (State of the Art, mittelgroß, klein, Fine-Tuning) sowie die Entscheidung, ob Wissen in Skills oder im Speicher liegen sollte

Neue Wettbewerbsdynamik

  • Das Ergebnis ist eine neue Wettbewerbsdynamik in Software, die nicht in jeder Kategorie gleichermaßen gilt
  • Märkte, die von den Major Labs (führenden AI-Forschungslaboren) priorisiert werden, profitieren von schnellerer Umsetzung und direkter Modellkontrolle
  • Darüber hinaus stehen jedoch Tausende eigenständige Märkte Startups offen
  • In einer Zeit, in der alle Unternehmen dieselben Modelle nutzen können, gewinnen die „best riders“ – also diejenigen mit der stärksten Kompetenz beim Entwurf und Betrieb des Harnesses

Noch keine Kommentare.

Noch keine Kommentare.