Praktischer Leitfaden zum Aufbau von Agenten von OpenAI [32-seitiges PDF]

xguru · 2025-04-28T10:01:02+09:00

Ein praktischer Leitfaden für Produkt- und Engineering-Teams, die erstmals LLM-basierte Agenten (agents) entwickeln Agenten sind im Gegensatz zu bestehenden Automatisierungssystemen Systeme, die auch in komplexen und mehrdeutigen Situationen selbst urteilen und handeln Es werden verschiedene Designmuster beschrieben, von Einzelagenten-Systemen bis hin zur Orchestrierung mehrerer Agenten Für Zuverlässigkeit und Sicherheit werden die Einrichtung von Guardrails sowie Strategien für menschliches Eingreifen (human intervention) hervorgehoben Empfohlen wird ein Ansatz, zunächst in kleinem Umfang zu starten und schrittweise auf Basis von Nutzerfeedback zu erweitern Was ist ein Agent? Ein Agent ist ein System, das Aufgaben im Auftrag des Nutzers ausführt Modelle, die nur einmalig antworten, wie einfache Chatbots oder Stimmungsanalysatoren, gelten nicht als Agenten Agenten verfügen über die folgenden zwei Kernfunktionen Steuerung der Workflow-Ausführung und Entscheidungsfindung: Beurteilung des Abschlusses, Fehlerkorrektur und Rückgabe der Kontrolle an den Nutzer bei Fehlschlägen Nutzung von Tools: Interaktion mit externen Systemen, um Daten zu erfassen oder Aktionen auszuführen Wann sollte man Agenten bauen? Geeignet für Bereiche, in denen traditionelle Automatisierung versagt oder schwer wartbar ist Geeignete Anwendungsfälle Komplexe Entscheidungsfindung: wenn eine differenzierte Beurteilung nötig ist, etwa bei der Genehmigung von Kundenerstattungen Schwer wartbare regelbasierte Systeme: wenn Regeln komplex sind, etwa bei der Automatisierung von Sicherheitsprüfungen Verarbeitung unstrukturierter Daten: wenn Dokumentenanalyse oder das Verstehen natürlicher Sprache erforderlich sind Grundelemente des Agenten-Designs Modell (Model): das LLM, das für Schlussfolgerungen und Entscheidungen zuständig ist Tools: API-Funktionen zur Interaktion mit externen Systemen Anweisungen (Instructions): klare Vorgaben, die das Verhalten des Agenten definieren Leitlinien zur Modellauswahl Prototypen zunächst mit dem leistungsstärksten Modell entwickeln → anschließend unter Berücksichtigung von Kosten und Latenz versuchen, auf ein kleineres Modell zu wechseln Evaluationskriterien (evals) festlegen, Genauigkeit prüfen und danach optimieren Wie Tools definiert werden sollten Tools in standardisierter Form entwerfen, um die Wiederverwendbarkeit zu erhöhen Tool-Typen Datenabfrage: DB-Suche, Lesen von Dokumenten, Websuche Aktionen ausführen: E-Mails versenden, CRM aktualisieren Orchestrierung: andere Agenten aufrufen, um Aufgaben zu verteilen Best Practices für das Schreiben von Anweisungen Vorhandene Betriebs- oder Richtliniendokumente nutzen, um klare schrittweise Anweisungen zu verfassen Aufgaben in kleinere Teile zerlegen und als konkrete Aktionen angeben Methoden zur Behandlung von Fehlern oder Ausnahmesituationen (Edge Cases) unbedingt einschließen Orchestrierungsmuster Einzelagenten-System Ein Agent bearbeitet mehrere Aufgaben über eine wiederholte Schleife (run loop) Reagiert mithilfe von Prompt-Templates auf unterschiedliche Situationen Es wird empfohlen, bei einem Einzelagenten zu bleiben, solange die Komplexität beherrschbar ist Multi-Agenten-System Manager-Muster (Manager Pattern) Ein zentraler Manager-Agent ruft mehrere spezialisierte Agenten wie Tools auf und koordiniert den Workflow Hält die Schnittstelle zum Nutzer konsistent Dezentrales Muster (Decentralized Pattern) Agenten übergeben sich die Kontrolle gegenseitig per Handoff Ein Agent mit einem bestimmten Fachgebiet übernimmt die Kontrolle genau dann, wenn er benötigt wird Eignet sich anfangs für einfache Triage-Aufgaben Guardrails Zweck Schutz der Datenprivatsphäre und Verhinderung von Systemmissbrauch Wahrung der Markenkonsistenz und Blockierung unangemessener Antworten Wichtige Typen Relevanzfilterung: Blockierung von Eingaben, die nichts mit dem Thema zu tun haben Sicherheitsfilterung: Erkennung von Versuchen zum Systemausbruch (jailbreak) PII-Filter zum Schutz personenbezogener Daten: Blockierung der Offenlegung sensibler Informationen Moderation: Blockierung von Gewalt und Hassrede Tool-Risikomanagement: zusätzliche Validierung bei Aufrufen von Hochrisiko-Tools Aufbaustrategie Datenprivatsphäre und Content-Sicherheit als höchste Priorität behandeln Kontinuierlich ergänzen, angepasst an neue Risiken, die im realen Einsatz entdeckt werden Sicherheitsanforderungen und Nutzererlebnis in Balance bringen Menschliches Eingreifen (Human-in-the-loop) Die Kontrolle an Menschen übergeben, wenn der Agent scheitert oder risikoreiche Aufgaben bearbeitet Typische Auslöser Überschreiten eines Fehlerschwellenwerts Anfragen für sensible Aufgaben mit hohem Risiko (Erstattungen, Zahlungen usw.) Fazit Agenten sind innovative Systeme, die Workflows in komplexen und unsicheren Situationen automatisieren können Eine starke Modell-Tool-Anweisungs-Struktur aufbauen und die Orchestrierung schrittweise erweitern Guardrails und menschliches Eingreifen müssen zwingend eingerichtet werden, um Sicherheit und Zuverlässigkeit zu gewährleisten Klein anfangen, schnell validieren und Funktionen schrittweise erweitern ist der Schlüssel zu einer erfolgreichen Bereitstellung

(cdn.openai.com)

22 Punkte von xguru 2025-04-28 | 1 Kommentare | Auf WhatsApp teilen

Ein praktischer Leitfaden für Produkt- und Engineering-Teams, die erstmals LLM-basierte Agenten (agents) entwickeln
Agenten sind im Gegensatz zu bestehenden Automatisierungssystemen Systeme, die auch in komplexen und mehrdeutigen Situationen selbst urteilen und handeln
Es werden verschiedene Designmuster beschrieben, von Einzelagenten-Systemen bis hin zur Orchestrierung mehrerer Agenten
Für Zuverlässigkeit und Sicherheit werden die Einrichtung von Guardrails sowie Strategien für menschliches Eingreifen (human intervention) hervorgehoben
Empfohlen wird ein Ansatz, zunächst in kleinem Umfang zu starten und schrittweise auf Basis von Nutzerfeedback zu erweitern

Was ist ein Agent?

Ein Agent ist ein System, das Aufgaben im Auftrag des Nutzers ausführt
Modelle, die nur einmalig antworten, wie einfache Chatbots oder Stimmungsanalysatoren, gelten nicht als Agenten
Agenten verfügen über die folgenden zwei Kernfunktionen
- Steuerung der Workflow-Ausführung und Entscheidungsfindung: Beurteilung des Abschlusses, Fehlerkorrektur und Rückgabe der Kontrolle an den Nutzer bei Fehlschlägen
- Nutzung von Tools: Interaktion mit externen Systemen, um Daten zu erfassen oder Aktionen auszuführen

Wann sollte man Agenten bauen?

Geeignet für Bereiche, in denen traditionelle Automatisierung versagt oder schwer wartbar ist
Geeignete Anwendungsfälle
- Komplexe Entscheidungsfindung: wenn eine differenzierte Beurteilung nötig ist, etwa bei der Genehmigung von Kundenerstattungen
- Schwer wartbare regelbasierte Systeme: wenn Regeln komplex sind, etwa bei der Automatisierung von Sicherheitsprüfungen
- Verarbeitung unstrukturierter Daten: wenn Dokumentenanalyse oder das Verstehen natürlicher Sprache erforderlich sind

Grundelemente des Agenten-Designs

Modell (Model): das LLM, das für Schlussfolgerungen und Entscheidungen zuständig ist
Tools: API-Funktionen zur Interaktion mit externen Systemen
Anweisungen (Instructions): klare Vorgaben, die das Verhalten des Agenten definieren

Leitlinien zur Modellauswahl

Prototypen zunächst mit dem leistungsstärksten Modell entwickeln → anschließend unter Berücksichtigung von Kosten und Latenz versuchen, auf ein kleineres Modell zu wechseln
Evaluationskriterien (evals) festlegen, Genauigkeit prüfen und danach optimieren

Wie Tools definiert werden sollten

Tools in standardisierter Form entwerfen, um die Wiederverwendbarkeit zu erhöhen
Tool-Typen
- Datenabfrage: DB-Suche, Lesen von Dokumenten, Websuche
- Aktionen ausführen: E-Mails versenden, CRM aktualisieren
- Orchestrierung: andere Agenten aufrufen, um Aufgaben zu verteilen

Best Practices für das Schreiben von Anweisungen

Vorhandene Betriebs- oder Richtliniendokumente nutzen, um klare schrittweise Anweisungen zu verfassen
Aufgaben in kleinere Teile zerlegen und als konkrete Aktionen angeben
Methoden zur Behandlung von Fehlern oder Ausnahmesituationen (Edge Cases) unbedingt einschließen

Orchestrierungsmuster

Einzelagenten-System

Ein Agent bearbeitet mehrere Aufgaben über eine wiederholte Schleife (run loop)
Reagiert mithilfe von Prompt-Templates auf unterschiedliche Situationen
Es wird empfohlen, bei einem Einzelagenten zu bleiben, solange die Komplexität beherrschbar ist

Multi-Agenten-System

Manager-Muster (Manager Pattern)

Ein zentraler Manager-Agent ruft mehrere spezialisierte Agenten wie Tools auf und koordiniert den Workflow
Hält die Schnittstelle zum Nutzer konsistent

Dezentrales Muster (Decentralized Pattern)

Agenten übergeben sich die Kontrolle gegenseitig per Handoff
Ein Agent mit einem bestimmten Fachgebiet übernimmt die Kontrolle genau dann, wenn er benötigt wird
Eignet sich anfangs für einfache Triage-Aufgaben

Guardrails

Zweck

Schutz der Datenprivatsphäre und Verhinderung von Systemmissbrauch
Wahrung der Markenkonsistenz und Blockierung unangemessener Antworten

Wichtige Typen

Relevanzfilterung: Blockierung von Eingaben, die nichts mit dem Thema zu tun haben
Sicherheitsfilterung: Erkennung von Versuchen zum Systemausbruch (jailbreak)
PII-Filter zum Schutz personenbezogener Daten: Blockierung der Offenlegung sensibler Informationen
Moderation: Blockierung von Gewalt und Hassrede
Tool-Risikomanagement: zusätzliche Validierung bei Aufrufen von Hochrisiko-Tools

Aufbaustrategie

Datenprivatsphäre und Content-Sicherheit als höchste Priorität behandeln
Kontinuierlich ergänzen, angepasst an neue Risiken, die im realen Einsatz entdeckt werden
Sicherheitsanforderungen und Nutzererlebnis in Balance bringen

Menschliches Eingreifen (Human-in-the-loop)

Die Kontrolle an Menschen übergeben, wenn der Agent scheitert oder risikoreiche Aufgaben bearbeitet
Typische Auslöser
- Überschreiten eines Fehlerschwellenwerts
- Anfragen für sensible Aufgaben mit hohem Risiko (Erstattungen, Zahlungen usw.)

Fazit

Agenten sind innovative Systeme, die Workflows in komplexen und unsicheren Situationen automatisieren können
Eine starke Modell-Tool-Anweisungs-Struktur aufbauen und die Orchestrierung schrittweise erweitern
Guardrails und menschliches Eingreifen müssen zwingend eingerichtet werden, um Sicherheit und Zuverlässigkeit zu gewährleisten
Klein anfangen, schnell validieren und Funktionen schrittweise erweitern ist der Schlüssel zu einer erfolgreichen Bereitstellung

1 Kommentare

bluekai17 2025-05-02

https://notebooklm.google.com/notebook/…

Ich habe es mit NotebookLM erstellt.