Codex startet Unterstützung für Subagents

(developers.openai.com)

13 Punkte von GN⁺ 2026-03-17 | 4 Kommentare | Auf WhatsApp teilen

OpenAI Codex unterstützt jetzt Subagent-Workflows und kann komplexe Aufgaben parallel auf mehrere spezialisierte Agenten verteilen und die Ergebnisse zu einer Antwort zusammenführen
Subagenten werden nur erstellt, wenn der Nutzer dies ausdrücklich anfordert; da jeder Agent eigenständig Modelle und Tools verwendet, ist der Token-Verbrauch höher als bei einem einzelnen Agenten
Benutzerdefinierte Agenten lassen sich per TOML-Datei definieren, sodass Modell, Sandbox-Modus, MCP-Server usw. pro Agent unabhängig konfiguriert werden können
Ebenfalls enthalten ist die experimentelle Funktion spawn_agents_on_csv, die für jede Zeile einer CSV-Datei Worker-Agenten stapelweise erzeugt und jede Zeile als eigene Arbeitseinheit behandelt
Die offizielle Dokumentation zeigt direkt Muster zur Kombination benutzerdefinierter Agenten für reale Szenarien wie Code-Reviews oder Frontend-Debugging

Überblick und Verfügbarkeit von Subagenten

Codex unterstützt Subagent-Workflows, bei denen spezialisierte Agenten parallel erzeugt (spawned) und ihre Ergebnisse in einer einzigen Antwort gesammelt werden
Besonders nützlich ist das für komplexe Aufgaben mit hoher Parallelität, etwa das Erkunden einer Codebasis oder die Planung einer mehrstufigen Feature-Implementierung
In Subagent-Workflows lassen sich je nach Aufgabe auch benutzerdefinierte Agenten mit unterschiedlichen Modellkonfigurationen und Anweisungen definieren
In der aktuellen Codex-Version sind Subagent-Workflows standardmäßig aktiviert
Subagent-Aktivitäten sind derzeit in der Codex-App und CLI sichtbar; Sichtbarkeit in der IDE-Erweiterung folgt in Kürze
Subagenten werden nur erzeugt, wenn der Nutzer dies ausdrücklich anfordert; da jeder Subagent eigene Modell- und Tool-Aufgaben ausführt, ist der Token-Verbrauch höher als bei der Ausführung mit einem einzelnen Agenten

Allgemeiner Workflow

Codex übernimmt die Orchestrierung zwischen Agenten: neue Subagenten erzeugen, Folgeanweisungen weiterleiten, auf Ergebnisse warten und Agent-Threads beenden
Wenn mehrere Agenten laufen, wartet Codex, bis alle Anfrageergebnisse vorliegen, und gibt dann eine konsolidierte Antwort zurück
Beispiel-Prompt: Für den aktuellen PR jeweils einen Agenten pro Bereich für Sicherheitsprobleme, Codequalität, Bugs, Race Conditions, instabile Tests und Wartbarkeit erzeugen und anschließend das Gesamtergebnis zusammenfassen

Verwaltung von Subagenten

In der CLI kann mit dem Befehl /agent zwischen aktiven Agent-Threads gewechselt und laufende Threads geprüft werden
Man kann Codex direkt anweisen, laufende Subagenten zu steuern, zu stoppen oder abgeschlossene Threads zu beenden

Freigaben und Sandbox-Kontrolle

Subagenten erben die aktuelle Sandbox-Richtlinie des Nutzers
In interaktiven CLI-Sitzungen können Freigabeanfragen inaktiver Agent-Threads auch dann angezeigt werden, wenn der Haupt-Thread verwendet wird; im Freigabe-Overlay erscheint ein Label des Quell-Threads
- Mit o lässt sich der betreffende Thread öffnen, um freizugeben, abzulehnen oder zu antworten
In nicht interaktiven Abläufen können neue Freigaben nicht angezeigt werden; daher schlagen freigabepflichtige Aufgaben fehl und der Fehler wird an den übergeordneten Workflow weitergegeben
Beim Erzeugen eines Child-Agenten werden die Live-Runtime-Overrides des Parent-Turns erneut angewendet, einschließlich Änderungen durch /approvals oder interaktive Einstellungen wie --yolo
- Selbst wenn die ausgewählte benutzerdefinierte Agent-Datei andere Standardwerte setzt, haben die Einstellungen des Parent Vorrang
Für einzelne benutzerdefinierte Agenten lassen sich Sandbox-Einstellungen separat überschreiben (z. B. ein bestimmter Agent im Nur-Lese-Modus)

Benutzerdefinierte Agenten

Codex stellt drei standardmäßig integrierte Agenten bereit
- default: allgemeiner Fallback-Agent
- worker: ausführungsorientierter Agent mit Fokus auf Implementierung und Korrekturen
- explorer: leseorientierter Agent zum Erkunden der Codebasis
Für benutzerdefinierte Agenten werden separate TOML-Dateien unter ~/.codex/agents/ (persönlich) oder .codex/agents/ (projektweit) abgelegt
Jede Datei definiert genau einen benutzerdefinierten Agenten, den Codex als Konfigurationsebene für die Erzeugungssitzung lädt
Pflichtfelder, die in allen benutzerdefinierten Agent-Dateien enthalten sein müssen:
- name, description, developer_instructions
Optionale Felder wie nickname_candidates, model, model_reasoning_effort, sandbox_mode, mcp_servers, skills.config usw. werden bei Auslassung aus der Parent-Sitzung geerbt

Globale Konfiguration

Die globale Konfiguration für Subagenten wird im Abschnitt [agents] der Konfigurationsdatei definiert
agents.max_threads: Obergrenze für gleichzeitig geöffnete Agent-Threads (Standardwert 6)
agents.max_depth: Schachtelungstiefe erzeugter Agenten (Standardwert 1, erlaubt nur direkte Child-Agenten und verhindert tiefere Verschachtelung)
agents.job_max_runtime_seconds: Standard-Timeout pro Worker für spawn_agents_on_csv-Jobs (falls nicht gesetzt, standardmäßig 1800 Sekunden pro Aufruf)
Wenn ein benutzerdefinierter Agent denselben Namen wie ein integrierter Agent wie explorer hat, hat der benutzerdefinierte Agent Vorrang

Schema für benutzerdefinierte Agent-Dateien

name (string, Pflicht): der Agentenname, den Codex beim Erzeugen oder Referenzieren des Agenten verwendet
description (string, Pflicht): für Menschen gedachte Anleitung, wann Codex diesen Agenten verwenden soll
developer_instructions (string, Pflicht): die zentralen Anweisungen, die das Verhalten des Agenten definieren
nickname_candidates (string[], optional): Pool von angezeigten Spitznamen für erzeugte Agenten
Andere unterstützte config.toml-Schlüssel wie model, model_reasoning_effort, sandbox_mode, mcp_servers, skills.config usw. können ebenfalls enthalten sein
Codex identifiziert Agenten über das Feld name; den Dateinamen daran anzugleichen ist die einfachste Konvention, aber das Feld name ist die maßgebliche Quelle

Angezeigte Spitznamen

nickname_candidates dienen dazu, in der UI unterscheidbare Labels anzuzeigen, wenn mehrere Instanzen desselben benutzerdefinierten Agenten laufen
Spitznamen sind nur für die Anzeige gedacht; Codex identifiziert und erzeugt Agenten weiterhin über name
Kandidaten für Spitznamen müssen eine nicht leere Liste eindeutiger Namen sein und dürfen ASCII-Zeichen, Zahlen, Leerzeichen, Bindestriche und Unterstriche enthalten
Beispiel: Werden für den Agenten reviewer die Spitznamen ["Atlas", "Delta", "Echo"] gesetzt, dann werden in App und CLI die Spitznamen angezeigt, der zugrunde liegende Agent-Typ bleibt jedoch reviewer

Beispiel 1: Muster für PR-Reviews

Ein Muster, das das Review auf drei spezialisierte benutzerdefinierte Agenten aufteilt
- pr_explorer: Nur-Lese-Agent zum Mappen der Codebasis und Sammeln von Belegen (Modell: gpt-5.3-codex-spark, reasoning effort: medium)
- reviewer: PR-Reviewer zum Finden von Korrektheits-, Sicherheits- und Test-Risiken (Modell: gpt-5.4, reasoning effort: high)
- docs_researcher: Dokumentationsspezialist, der über einen dedizierten MCP-Server Framework- oder API-Dokumentation prüft (Modell: gpt-5.3-codex-spark, Nur-Lese-Modus)
Projektkonfiguration: max_threads = 6, max_depth = 1
Anweisungen für pr_explorer: Im Explorationsmodus bleiben, tatsächliche Ausführungspfade verfolgen, Dateien und Symbole zitieren und keine Änderungsvorschläge machen, sofern der Parent-Agent dies nicht anfordert
Anweisungen für reviewer: Aus Sicht des Owners reviewen, Korrektheit, Sicherheit, Verhaltensregressionen und fehlende Testabdeckung priorisieren, wenn möglich Reproduktionsschritte angeben und reine Stilkommentare vermeiden, sofern sie keinen echten Bug verdecken
Anweisungen für docs_researcher: Den Docs-MCP-Server nutzen, um APIs, Optionen und versionsspezifisches Verhalten zu prüfen, und knapp mit Links oder exakten Verweisen antworten; keine Codeänderungen
Beispiel-Prompt: "Diesen Branch im Vergleich zu main reviewen. pr_explorer soll betroffene Codepfade mappen, reviewer reale Risiken finden und docs_researcher die vom Patch verwendeten Framework-APIs validieren"

CSV-Stapelverarbeitung: spawn_agents_on_csv (experimentell)

Experimentelle Funktion, die sich künftig ändern kann
Bei vielen ähnlichen Aufgaben wird jede CSV-Zeile als eigene Arbeitseinheit verwendet, um Worker-Subagenten stapelweise zu erzeugen
Codex liest die CSV, erzeugt pro Zeile einen Worker-Agenten, wartet auf den Abschluss des gesamten Batches und exportiert die Ergebnisse als CSV
Geeignete Anwendungsfälle:
- Pro Zeile jeweils eine Datei, ein Paket oder einen Service reviewen
- Eine Liste von Incidents, PRs oder Migrationszielen prüfen
- Für viele ähnliche Eingaben strukturierte Zusammenfassungen erzeugen
Eingabeparameter des Tools: csv_path (Quell-CSV), instruction (Prompt-Vorlage für Worker, mit {column_name}-Platzhaltern), id_column (stabile Element-ID), output_schema (festes JSON-Format), output_csv_path, max_concurrency, max_runtime_seconds
Jeder Worker muss report_agent_job_result genau einmal aufrufen; endet er ohne Ergebnisbericht, wird die betreffende Zeile als Fehler markiert
Bei Ausführung mit codex exec wird während des Batch-Laufs in stderr eine einzeilige Fortschrittsaktualisierung angezeigt
Die exportierte CSV enthält die Original-Zeilendaten sowie Metadaten wie job_id, item_id, status, last_error, result_json
Relevante Runtime-Einstellungen: agents.max_threads (Obergrenze gleichzeitiger Threads), agents.job_max_runtime_seconds (Timeout pro Worker, wobei max_runtime_seconds pro Aufruf Vorrang hat), sqlite_home (SQLite-Pfad zur Statusspeicherung für Agent-Jobs und Exportergebnisse)

Beispiel 2: Muster für integriertes Frontend-Debugging

Ein nützliches Muster für UI-Regressionen, instabile Browser-Flows und integrierte Bugs, die Anwendungscode und das laufende Produkt zugleich betreffen
Kombination aus drei benutzerdefinierten Agenten:
- code_mapper: Nur-Lese-Explorationsagent zum Finden relevanter Frontend- und Backend-Codepfade (Modell: gpt-5.3-codex-spark, reasoning effort: medium)
- browser_debugger: UI-Debugger, der mit Browser-Tools Probleme reproduziert und Belege erfasst (Modell: gpt-5.4, reasoning effort: high, Sandbox: workspace-write)
  - Nutzt Browser-Tools für Screenshots, Konsolenausgaben und Netzwerkbelege; Änderungen am Anwendungscode sind untersagt
  - Verbindung zu einem Chrome-DevTools-MCP-Server (http://localhost:3000/mcp, startup_timeout_sec: 20)
- ui_fixer: implementierungsorientierter Agent für kleine, gezielte Korrekturen, sobald das Problem verstanden ist (Modell: gpt-5.3-codex-spark, reasoning effort: medium)
  - Führt die kleinste vertretbare Änderung durch, fasst keine nicht relevanten Dateien an und prüft nur das geänderte Verhalten
Beispiel-Prompt: "Untersuchen, warum das Einstellungs-Modal nicht speichern kann. browser_debugger soll das Problem reproduzieren, code_mapper die zugehörigen Codepfade verfolgen und ui_fixer nach Identifikation des Fehlermodus eine minimale Korrektur implementieren"

4 Kommentare

kgcrom 2026-03-17

Der Agent verwendet nur das Modell GPT-5.1-Codex-Mini,
aber wenn man in den Custom Instructions der Codex App
den folgenden Prompt hinzufügt, arbeitet der Agent mit GPT-5.3-Codex-Spark.

"- when it spawns agents, use models "GPT-5.3-Codex-Spark" or higher."

Außerdem macht es durchaus Spaß, beim Erstellen von Agents das Modell festzulegen,
und ich finde es gut, dass die Codex App die Struktur in Unterordnern anzeigt.

hmmhmmhm 2026-03-17

Ich habe bei einer krassen Rabattaktion auf KakaoTalk zugeschlagen und nutze es seitdem wirklich super gerne, haha.

shakespeares 2026-03-17

Schade, vielleicht gibt es also wieder keine Veranstaltung? seufz

xguru 2026-03-17

Codex, bitte baut auch schnell eine Fernsteuerung!