Andrew Ng: Der aktuelle Stand von AI-Agenten [YouTube]

(youtube.com)

19 Punkte von GN⁺ 2025-06-16 | 2 Kommentare | Auf WhatsApp teilen

Andrew Ng schlägt vor, sich rund um die Konzepte AI-Agenten und agentische (agentic) Systeme weniger auf Definitionsdebatten zu konzentrieren, sondern auf das Spektrum der Autonomie
Die realen Geschäftschancen liegen derzeit eher bei einfachen, linearen Workflows oder solchen mit nur kleinen Verzweigungen als bei komplexen vollautonomen Agenten
Praktische Fähigkeiten für Entwurf und Betrieb agentischer Systeme – etwa Aufgabenzerlegung, Evaluierungssysteme, Datenanbindung usw. – sind weiterhin selten, und der kompetente Einsatz verschiedenster Tools ist wichtig
Evals, Voice Stack und AI-Code-Assistenten werden als zentrale Werkzeuge genannt, die bislang nicht genug Aufmerksamkeit erhalten
Die Schlüsselfaktoren für den Erfolg von Startups sind Umsetzungsgeschwindigkeit und tiefes technisches Verständnis; mit dem Fortschritt bei AI-Tools hilft es auch mehr Nicht-Entwicklern, grundlegende Coding-Fähigkeiten zu erwerben, um die Produktivität zu steigern

Introduction

Einführung in den Hintergrund, wie Andrew Ng zu verschiedenen AI-/Agenten-Projekten und Communities wie LangChain beigetragen hat
Statt über die Definition von Agenten zu streiten, wird betont, dass agentische Systeme unterschiedliche Grade an Autonomie haben können
Es wird vorgeschlagen, nicht zu fragen, ob etwas ein „echter Agent“ ist, sondern Autonomie als Spektrum zu sehen und pragmatisch vorzugehen

Opportunities: Reale Geschäftschancen

Viele reale Business-Workflows bestehen tatsächlich aus linearen Abläufen oder enthalten nur leichte Verzweigungen
- Beispiele: Ausfüllen von Webformularen, Datenbankabfragen, einfache Suche und andere repetitive Automatisierungsaufgaben
Aufgabenzerlegung und Feintuning in Mikroaufgaben, die Gestaltung von Evaluierungsmetriken und die Verbesserung von Workflows sind in der Praxis seltene Kompetenzen
Komplexe agentische Workflows sind zwar wichtig, aber der Großteil der Wertschöpfung entsteht in einfachen, wiederholbaren Strukturen

Skills: Fähigkeiten, die Agent-Builder brauchen

Erforderlich sind systematische Designfähigkeiten wie das Verstehen von Geschäftsprozessen, Datenerfassung/-integration, Prompting und Prozessaufteilung
Automatisierte Evaluierungssysteme sind wichtig, etwa zur Leistungsverfolgung pro System/Komponente und zum Aufbau von Evaluierungs-Frameworks
Erfahrene Teams versteifen sich nicht auf „unnötige Verbesserungen“, sondern umgehen oder ersetzen Probleme effizient
Wer viele AI-Tools und Frameworks praktisch ausprobiert hat, ist bei Entscheidungen, Experimenten und der Tool-Kombination im Lego-Baustein-Stil deutlich schneller

AI Tools & Wandel

In den letzten 2–3 Jahren ist das Ökosystem von AI-Tools vielfältiger geworden, z. B. Langgraph, RAG, Chatbots, Memory-Management, Evaluierung/Guardrails
Tools lassen sich wie Lego-Bausteine vielfältig kombinieren; mit wachsender Praxiserfahrung werden schnelle Entscheidungen möglich
Durch das größere Kontextfenster von LLMs verändert sich die praktische Rolle einiger Techniken wie RAG – die Bedeutung von Hyperparameter-Tuning nimmt ab

Underrated Tools: Unterschätzte Kernwerkzeuge

Evals (automatisierte Evaluierung): Viele Teams halten das für unnötig schwierig, doch wichtig ist die Gewohnheit, mit kleinen Beispielen schnell zu implementieren und zu verbessern
Voice Stack (sprachbasierte Workflows): In großen Unternehmen steigen Nachfrage und Nutzung schnell, doch in der Entwickler-Community fehlt noch Aufmerksamkeit
AI-Code-Assistenten: AI-gestütztes Coding erhöht die Produktivität; wenn alle Teammitglieder grundlegende Coding-Fähigkeiten lernen, verbessert das die Produktivität in vielen Rollen
- Beispiel aus dem AI Fund: Vom Empfang über den CFO bis zu Juristen lernen alle Coding und steigern so ihre Arbeitseffizienz

Eigenschaften von Voice Applications

Spracheingabe reduziert die Hürde für Nutzer stärker als Text-Prompts und ermöglicht eine schnellere Informationseingabe
Bei sprachbasierten Agenten ist die Reaktionszeit (Latenz) extrem wichtig (idealerweise unter 1 Sekunde); für Echtzeitinteraktion kommen verschiedene UX-Tricks zum Einsatz, z. B. Pre-Response und Hintergrundgeräusche
Sprachinterfaces haben ein sehr großes potenzielles Einsatzfeld, benötigen aber mehr Entwickler-Tools und unterstützende Infrastruktur

MCP: Standardisierung und Datenintegration

MCP (Mesh Capability Protocol): Ein Branchentrend, verschiedene Datenquellen, APIs und Tools über standardisierte Interfaces zu verbinden
Der MCP-Standard steckt noch in den Anfängen, dürfte sich aber zu einer zentralen Achse zur Vereinfachung komplexer Daten- und Tool-Integration entwickeln
Die Vision ist, beim Verbinden von n Agenten mit m Datenquellen Integration zu Kosten von n+m statt n*m zu ermöglichen

Agent-to-Agent-Systeme

Multi-Agent-Systeme und Interaktionen zwischen Agenten befinden sich noch in einer sehr frühen Phase; bislang gibt es die meisten realen Erfolge innerhalb desselben Teams
Interaktionen zwischen Agenten verschiedener Teams oder Unternehmen sind ein Bereich für künftige Entwicklung

Vibe Coding und AI-Coding

Das Phänomen „Vibe Coding“ mit AI-Assistenten erfordert in Wirklichkeit hohe Konzentration und intellektuelle Arbeit; anders als der Name vermuten lässt, wird nicht bloß „nach Gefühl“ programmiert
Durch die Weiterentwicklung von AI-Code-Assistenten steigt die Bedeutung von Coding-Kompetenz auch für mehr Nicht-Entwickler und andere Berufsrollen
Coding zu lernen ist ein Schlüssel zur künftigen Produktivität – empfohlen wird, zumindest eine Programmiersprache (insbesondere Python) zu beherrschen

Advice for Startups: Ratschläge für AI-Startups

Der wichtigste Erfolgsfaktor für Startups ist Umsetzungsgeschwindigkeit, an zweiter Stelle steht tiefes Verständnis der Technologie
Marketing, Vertrieb und Pricing sind wichtig, doch das Verständnis dafür, wie Technologie tatsächlich funktioniert und wie sich der Stand der Technik verändert, ist noch seltener und wichtiger
Teams mit einem tiefen Gespür für das technische Wesen können Probleme schneller und effizienter lösen

2 Kommentare

namojo 2025-06-16

MCP (Mesh Capability Protocol) ist an dieser Stelle wohl ein Tippfehler, oder?
Entscheidend für den Erfolg scheint zu sein, wie man bei Agenten Funktionen und Berechtigungen aufteilt und den Workflow gestaltet.

beoks 2025-06-16

Da MCP erst seit Kurzem ein aufgekommener Begriff ist, scheint das LLM ihn nicht gelernt zu haben und deshalb seltsame Wörter zu verwenden, lol