- Andrew Ng schlägt vor, sich rund um die Konzepte AI-Agenten und agentische (agentic) Systeme weniger auf Definitionsdebatten zu konzentrieren, sondern auf das Spektrum der Autonomie
- Die realen Geschäftschancen liegen derzeit eher bei einfachen, linearen Workflows oder solchen mit nur kleinen Verzweigungen als bei komplexen vollautonomen Agenten
- Praktische Fähigkeiten für Entwurf und Betrieb agentischer Systeme – etwa Aufgabenzerlegung, Evaluierungssysteme, Datenanbindung usw. – sind weiterhin selten, und der kompetente Einsatz verschiedenster Tools ist wichtig
- Evals, Voice Stack und AI-Code-Assistenten werden als zentrale Werkzeuge genannt, die bislang nicht genug Aufmerksamkeit erhalten
- Die Schlüsselfaktoren für den Erfolg von Startups sind Umsetzungsgeschwindigkeit und tiefes technisches Verständnis; mit dem Fortschritt bei AI-Tools hilft es auch mehr Nicht-Entwicklern, grundlegende Coding-Fähigkeiten zu erwerben, um die Produktivität zu steigern
Introduction
- Einführung in den Hintergrund, wie Andrew Ng zu verschiedenen AI-/Agenten-Projekten und Communities wie LangChain beigetragen hat
- Statt über die Definition von Agenten zu streiten, wird betont, dass agentische Systeme unterschiedliche Grade an Autonomie haben können
- Es wird vorgeschlagen, nicht zu fragen, ob etwas ein „echter Agent“ ist, sondern Autonomie als Spektrum zu sehen und pragmatisch vorzugehen
Opportunities: Reale Geschäftschancen
- Viele reale Business-Workflows bestehen tatsächlich aus linearen Abläufen oder enthalten nur leichte Verzweigungen
- Beispiele: Ausfüllen von Webformularen, Datenbankabfragen, einfache Suche und andere repetitive Automatisierungsaufgaben
- Aufgabenzerlegung und Feintuning in Mikroaufgaben, die Gestaltung von Evaluierungsmetriken und die Verbesserung von Workflows sind in der Praxis seltene Kompetenzen
- Komplexe agentische Workflows sind zwar wichtig, aber der Großteil der Wertschöpfung entsteht in einfachen, wiederholbaren Strukturen
Skills: Fähigkeiten, die Agent-Builder brauchen
- Erforderlich sind systematische Designfähigkeiten wie das Verstehen von Geschäftsprozessen, Datenerfassung/-integration, Prompting und Prozessaufteilung
- Automatisierte Evaluierungssysteme sind wichtig, etwa zur Leistungsverfolgung pro System/Komponente und zum Aufbau von Evaluierungs-Frameworks
- Erfahrene Teams versteifen sich nicht auf „unnötige Verbesserungen“, sondern umgehen oder ersetzen Probleme effizient
- Wer viele AI-Tools und Frameworks praktisch ausprobiert hat, ist bei Entscheidungen, Experimenten und der Tool-Kombination im Lego-Baustein-Stil deutlich schneller
AI Tools & Wandel
- In den letzten 2–3 Jahren ist das Ökosystem von AI-Tools vielfältiger geworden, z. B. Langgraph, RAG, Chatbots, Memory-Management, Evaluierung/Guardrails
- Tools lassen sich wie Lego-Bausteine vielfältig kombinieren; mit wachsender Praxiserfahrung werden schnelle Entscheidungen möglich
- Durch das größere Kontextfenster von LLMs verändert sich die praktische Rolle einiger Techniken wie RAG – die Bedeutung von Hyperparameter-Tuning nimmt ab
Underrated Tools: Unterschätzte Kernwerkzeuge
- Evals (automatisierte Evaluierung): Viele Teams halten das für unnötig schwierig, doch wichtig ist die Gewohnheit, mit kleinen Beispielen schnell zu implementieren und zu verbessern
- Voice Stack (sprachbasierte Workflows): In großen Unternehmen steigen Nachfrage und Nutzung schnell, doch in der Entwickler-Community fehlt noch Aufmerksamkeit
- AI-Code-Assistenten: AI-gestütztes Coding erhöht die Produktivität; wenn alle Teammitglieder grundlegende Coding-Fähigkeiten lernen, verbessert das die Produktivität in vielen Rollen
- Beispiel aus dem AI Fund: Vom Empfang über den CFO bis zu Juristen lernen alle Coding und steigern so ihre Arbeitseffizienz
Eigenschaften von Voice Applications
- Spracheingabe reduziert die Hürde für Nutzer stärker als Text-Prompts und ermöglicht eine schnellere Informationseingabe
- Bei sprachbasierten Agenten ist die Reaktionszeit (Latenz) extrem wichtig (idealerweise unter 1 Sekunde); für Echtzeitinteraktion kommen verschiedene UX-Tricks zum Einsatz, z. B. Pre-Response und Hintergrundgeräusche
- Sprachinterfaces haben ein sehr großes potenzielles Einsatzfeld, benötigen aber mehr Entwickler-Tools und unterstützende Infrastruktur
MCP: Standardisierung und Datenintegration
- MCP (Mesh Capability Protocol): Ein Branchentrend, verschiedene Datenquellen, APIs und Tools über standardisierte Interfaces zu verbinden
- Der MCP-Standard steckt noch in den Anfängen, dürfte sich aber zu einer zentralen Achse zur Vereinfachung komplexer Daten- und Tool-Integration entwickeln
- Die Vision ist, beim Verbinden von n Agenten mit m Datenquellen Integration zu Kosten von n+m statt n*m zu ermöglichen
Agent-to-Agent-Systeme
- Multi-Agent-Systeme und Interaktionen zwischen Agenten befinden sich noch in einer sehr frühen Phase; bislang gibt es die meisten realen Erfolge innerhalb desselben Teams
- Interaktionen zwischen Agenten verschiedener Teams oder Unternehmen sind ein Bereich für künftige Entwicklung
Vibe Coding und AI-Coding
- Das Phänomen „Vibe Coding“ mit AI-Assistenten erfordert in Wirklichkeit hohe Konzentration und intellektuelle Arbeit; anders als der Name vermuten lässt, wird nicht bloß „nach Gefühl“ programmiert
- Durch die Weiterentwicklung von AI-Code-Assistenten steigt die Bedeutung von Coding-Kompetenz auch für mehr Nicht-Entwickler und andere Berufsrollen
- Coding zu lernen ist ein Schlüssel zur künftigen Produktivität – empfohlen wird, zumindest eine Programmiersprache (insbesondere Python) zu beherrschen
Advice for Startups: Ratschläge für AI-Startups
- Der wichtigste Erfolgsfaktor für Startups ist Umsetzungsgeschwindigkeit, an zweiter Stelle steht tiefes Verständnis der Technologie
- Marketing, Vertrieb und Pricing sind wichtig, doch das Verständnis dafür, wie Technologie tatsächlich funktioniert und wie sich der Stand der Technik verändert, ist noch seltener und wichtiger
- Teams mit einem tiefen Gespür für das technische Wesen können Probleme schneller und effizienter lösen
2 Kommentare
MCP (Mesh Capability Protocol) ist an dieser Stelle wohl ein Tippfehler, oder?
Entscheidend für den Erfolg scheint zu sein, wie man bei Agenten Funktionen und Berechtigungen aufteilt und den Workflow gestaltet.
Da MCP erst seit Kurzem ein aufgekommener Begriff ist, scheint das LLM ihn nicht gelernt zu haben und deshalb seltsame Wörter zu verwenden, lol