- Von OpenAI selbst veröffentlichtes Webinar-Video zu Codex für Entwickler (58 Minuten)
- Codex ist eine Coding-Agent-Plattform, die über Codevervollständigung oder Pair Programming hinausgeht und so konzipiert ist, dass Ingenieure umfangreiche Aufgaben an Agenten delegieren können
- Codex-App, CLI, IDE-Erweiterungen und weitere verschiedene Interfaces teilen sich dasselbe Backend, und mehrere Aufgaben können parallel gleichzeitig ausgeführt werden
- Deckt den gesamten Software Development Lifecycle (SDLC) ab – von Planung (Plan), Design, Build, Test, Review und Dokumentation bis hin zu Bereitstellung und Wartung (Deploy & Maintenance)
- Über die Datei agents.md lassen sich Verhaltensrichtlinien für Agenten auf Repository-Ebene festlegen; mit Skills und Automations können wiederkehrende Workflows paketiert und automatisch ausgeführt werden
- Unterstützt 25 Stunden unterbrechungsfreie Arbeit und die Aufrechterhaltung von Langzeitkontext durch 13–14 serverseitige Compactions; Sicherheit wird durch Sandboxen auf OS-Ebene gewährleistet
Die Evolution des AI-Codings: von Codevervollständigung zur Agenten-Delegation
- In den vergangenen Jahren hat sich AI-Coding von Codevervollständigung (ca. 10 % höhere Tippgeschwindigkeit) über Pair Programming (planen über mehrere Dateien hinweg, Tests ausführen, Repos anpassen) weiterentwickelt
- Beide Ansätze konzentrierten sich darauf, einen „besseren Kollaborateur“ zu schaffen, doch bei Codex begann die Entwicklung bereits vor einem Jahr mit dem Ziel, delegierbare Agenten zu bauen
- Im Dezember 2025 beseitigte das GT-5.2-Codex-Modell mit langer unterbrechungsfreier Laufzeit und hoher Steuerbarkeit (steerability) die zentrale Hürde für „echte Agenten-Delegation“
- Danach wurde die Leistung mit dem schnelleren und effizienteren GT 5.3 sowie dem neuesten GT 5.4 kontinuierlich verbessert
- Wichtige Fortschritte sind die stabile Navigation in großen Enterprise-Codebasen und das langfristige Beibehalten der Ausrichtung auf die Nutzerabsicht
Verfügbare Interfaces für Codex
- Ein einzelner Codex-Agent kann über mehrere Oberflächen wie CLI, IDE-Erweiterung und Codex-App genutzt werden; alle teilen sich dasselbe Backend
- Die Codex-App ist das visuellste Interface für parallele Arbeit und dafür optimiert, mehrere Agenten gleichzeitig auszuführen und deren Ausgaben zu prüfen
- Fallbeispiel von Peter Steinberger (Gründer von OpenClaw): Der Wechsel von der Verwaltung von mehr als 10 CLI-Fenstern zur Codex-App verbesserte die Effizienz beim Management paralleler Agenten
- Unterstützt macOS und Windows; Download über openai.com/codex, unter Windows auch im Microsoft Store verfügbar
- In der CLI erfolgt die erste Anmeldung mit dem Befehl
codex login, danach startet eine Sitzung mit codex
Codex-App-UI und Einstellungen
- Modellauswahl (z. B. GPT 5.4) und Anpassung des reasoning effort möglich: low, medium, high, extra high
- medium ist der Standardwert und bietet die beste Balance zwischen Geschwindigkeit und Denktiefe
- Für einfache Fragen eignet sich low, für langes tiefes Nachdenken high oder extra high
- Mit dem Speed-Modus-Schalter (fast/standard) lässt sich die Antwortgeschwindigkeit steuern
- Neben lokaler Arbeit gibt es den Git-worktree-Modus und die Option, entfernte Cloud-Container zu starten
- Berechtigungseinstellungen: Wahl zwischen Standardrechten (Dateien im Projekt lesen/bearbeiten, Genehmigung bei riskanten Befehlen anfordern) und Vollzugriff (alle Dateien auf dem Computer, Netzwerkzugriff, Ausführung ohne Genehmigung)
- Für neue Nutzer werden Standardrechte empfohlen
- In der linken Seitenleiste können Projekte (Ordner) hinzugefügt und gewechselt werden
Einsatz von Codex in allen Phasen des SDLC
- OpenAI hat den Leitfaden „Building an AI Native Engineering Team“ veröffentlicht, der zusammenfasst, wie Coding-Agenten alle 7 SDLC-Phasen beschleunigen: Planung, Design, Build, Test, Review, Dokumentation, Bereitstellung/Wartung
- Besonders Test- und Review-Phasen werden mit steigender Codegenerierungsfähigkeit noch wichtiger
- Codex wird insbesondere für Schlussfolgerungen in komplexen Codebasen und das Schreiben produktionsreifer Software hoch bewertet
Planungsphase (Plan)
- Durch Aktivieren des Plan-Modus (
/plan oder Shift+Tab) erstellt Codex vor der Implementierung zunächst einen Plan
- In der Demo bat man um einen Plan für eine SwiftUI-iOS-Companion-App; Codex durchsuchte daraufhin die Codebasis und stellte Rückfragen (Authentifizierungsmethode, Umfang des ersten Releases usw.)
- Der Agent lässt sich durch Annahme empfohlener Optionen oder durch direkte Eingabe steuern
- Annahmen zum Plan werden ausdrücklich genannt, sodass Nutzer sie prüfen und korrigieren können
Designphase — MCP-Integration
- Über MCP (Model Context Protocol) kann Kontext aus externen Tools wie Figma oder Linear direkt an Codex angebunden werden
- Unterstützt in CLI, IDE-Erweiterung und Codex-App
- Bei der Figma-MCP-Integration ruft Codex den Designkontext ab, wenn ein Design-Link eingefügt wird, und wandelt ihn in Code um
- Ist MCP nicht eingerichtet, zeigt Codex automatisch Installationshinweise an
- Auch die Integration der ChatGPT-App ist als von Dritten erstellte Anbindung direkt in Codex nutzbar
- Dadurch können Ingenieure sich auf die Kernlogik konzentrieren, während Designer mehr Zeit in die Erkundung von Designkonzepten investieren können
Build-Phase
- Die Phase mit dem größten Einfluss von Coding-Agenten im SDLC
- In der Demo wurden die Behebung einer N+1-Query-Ineffizienz, das Hinzufügen von Regressionstests, die Prüfung fehlender API-Route-Authentifizierung und die Migration von NextAuth v4 zu Auth.js v5 parallel ausgeführt
- Ergebnis der codegenerierung auf Basis eines Figma-Designs: Änderungen in 10 Dateien, 320 Zeilen Code geschrieben, keine manuelle CSS-Arbeit erforderlich
- Mit der Worktree-Funktion werden automatisch Kopien des lokalen Projekts erstellt, um Konflikte zwischen parallelen Aufgaben zu vermeiden; ein separates Kopieren des Repositories ist nicht nötig
- In agents.md definierte Validierungs-, Build- und Lint-Befehle wie
npx tsc oder npm test führt Codex automatisch aus, um die Einhaltung von Teamkonventionen zu prüfen
- Der Build selbst ist kein Bottleneck mehr; in Enterprise-Umgebungen ist entscheidend, zu validieren, ob der Code den Teamregeln entspricht
- Das Terminal lässt sich mit Command+J direkt in der App öffnen und verwenden
- Auch bei iOS-Apps kann
xcode build direkt in der Codex-App ausgeführt werden, ohne Xcode selbst zu öffnen
Slash Commands
- Slash Commands werden in CLI, IDE-Erweiterung und Codex-App unterstützt: Plan-Modus, File Mentions, Sitzungsstatus prüfen, Berechtigungen ändern usw.
- Mit dem Befehl
/experimental lassen sich experimentelle Funktionen umschalten
- Einschließlich der Erstellung von Multi-Agenten (Sub-Agents)
- Die CLI erhält neue Funktionen etwas früher als andere Interfaces
- In einem Interface umgeschaltete Einstellungen werden wegen des gemeinsamen Backends auf alle Interfaces angewendet
Review-Phase
- Mit dem Befehl
/review lässt sich ein Code-Review gegen den Basis-Branch oder gegen lokale uncommittete Änderungen ausführen
- Codex-Agenten sind speziell darauf trainiert, Bugs der Stufen P0/P1 zu identifizieren, und liefern daher signalstarkes Feedback mit wenig Rauschen
- So lassen sich Probleme frühzeitig lokal erkennen, bevor ein PR die CI/CD-Pipeline erreicht
- Native GitHub-Cloud-Integration: Codex führt für PRs automatisch proaktive oder reaktive Code-Reviews durch
- Vorgestellt wurde ein Fall, in dem ein P1-Problem entdeckt wurde, das Menschen leicht übersehen, etwa bei der Prüfung von Regex-Regeln
- Andere SCMs wie GitLab oder Bitbucket können über das Codex SDK direkt integriert werden
- Werden im Diff-Panel direkt Code-Review-Kommentare hinzugefügt, fließen sie automatisch als Kontext in die nächste Unterhaltung ein
Skills — Wiederverwendbare Workflow-Pakete
- Ein Skill ist ein offener Standard, der wiederverwendbare Workflow-Anweisungen paketiert, die Codex ausführen kann
- Strukturell ist es ein einzelner Ordner; die Pflichtdatei ist skill.md (Metadaten + Agentenanweisungen)
- Optional können Ausführungsskripte, Dokumentation und Templates ergänzt werden
- MCP kann in einen Skill eingebettet werden, um auch externe Tools zu integrieren
- Demo-Beispiele: Verarbeitung von PR-Kommentaren, automatische Behebung fehlgeschlagener BuildKite-Builds, Erkennung von Dead Code
- Skill Creator (System-Skill): Bei einer Anfrage wie „create a skill to find dead code paths“ wird automatisch ein Gerüst für skill.md erzeugt
- Skill Installer (System-Skill): Installiert den erzeugten Skill sofort in das lokale Codex-Skill-Verzeichnis
- Werden nach langen Unterhaltungen wiederkehrende Workflows in Skills umgewandelt, lässt sich beim nächsten Mal der gesamte Workflow mit einem einzigen Aufruf ausführen
- Beispiel für den GitHub Issue Plan PR Skill: Mit einem Prompt werden GitHub-Issue-Triage, Planung, Bearbeitung, Dokumentation und die Erstellung eines Draft-PRs in einem Durchgang erledigt
Dokumentationsphase
- Einer der am meisten unterschätzten Einsatzbereiche von Codex
- Unterstützt die Erstellung von Systemdiagrammen und die automatische Aktualisierung von Dokumentation bei Feature-Implementierungen
- Vorgestellt wurde eine Demo, in der über Linear MCP Änderungen zu einem bestimmten Ticket, Ergebnisse von Regressionstests und Validierungsdetails automatisch im Linear-Board dokumentiert wurden
Bereitstellung und Wartung (Deploy & Maintenance)
- In der Codex-App können Commit, Push und PR-Erstellung per Klick direkt ausgeführt werden (Git-basiert)
- Wird ein Stack Trace eingefügt, erschließt Codex die gesamte Codebasis, um die Ursache eines Problems zu finden
- Triage Page Skill: Gibt man eine Incident-ID ein, werden Details gesammelt, der Incident bestätigt, Metriken und Logs geprüft und sogar ein Patch in einem Durchgang erstellt
- Die Reaktion auf Pager-Duty-Fälle wird damit von manueller Log-Analyse auf Agenten-Delegation umgestellt
- PR Babysitter Skill: Überwacht den Fortschritt der CI/CD-Pipeline eines PR kontinuierlich und behebt Probleme automatisch, bis der PR am Ende vollautomatisch gemergt wird
- Bereits im Einsatz in OpenAIs großem Monorepo-Umfeld
- Kann aus einem Open-Source-Skill-Repository heruntergeladen werden
Automations — Zeitgesteuerte automatische Ausführung
- Wer mit Skills vertraut ist, kann mit Automations die automatische Ausführung von Aufgaben zu festgelegten Zeiten konfigurieren
- Sentry-Skill-Automatisierung: Findet jeden Donnerstag (oder täglich) Issues in einem bestimmten Repository und schlägt Korrekturen vor oder behebt sie automatisch
- „What is everyone up to?“-Automatisierung: Gibt jeden Morgen um 9 Uhr eine Zusammenfassung der Aktivitäten der Teammitglieder im Repository aus
- Auch ohne direkte Prompteingabe arbeitet Codex im Hintergrund kontinuierlich weiter
Funktionsweise der Codex-Agenten
- Codex-Agenten arbeiten schleifenbasiert: Der Nutzer gibt ein klares Ziel und eine erste Richtung vor → der Agent wiederholt Schlussfolgern, Tool-Aufrufe, Dateilesen, Repository-Suche, Code schreiben und Befehle ausführen
- Die Ergebnisse jedes Tools werden an den nächsten Modellaufruf zurückgespielt, sodass sich schrittweise Verständnis und Fortschritt aufbauen
- Kontext ist die zentrale Variable für die Leistung des Agenten: Wichtig ist, mit der richtigen Menge Input die richtige Richtung vorzugeben
- Sandboxing auf OS-Ebene: keine leichte Einschränkung auf Harness-Ebene, sondern Kontrolle von Netzwerk- und Dateizugriff auf Betriebssystemebene
- Ein Design als Vorsorge dafür, dass Modelle mit wachsender Leistungsfähigkeit leichte Schutzmechanismen umgehen könnten
- Sandbox-Unterstützung auf allen Systemen (Mac, Windows); unter Windows ist eine native Windows-Sandbox implementiert, die sicherer als WSL ist
- In der config-TOML-Datei lassen sich Details für approval mode (Zeitpunkt der Genehmigung) und sandbox mode (Zugriffsbereich) festlegen
- Der Standardwert ist „on request“: normal ausführen und nur bei nötiger Rechteerweiterung pausieren
Compaction — Verwaltung lang laufender Threads
- Wenn sich eine Unterhaltung dem Kontextlimit des Modells nähert, führt Codex eine Compaction durch, bei der der Anfangsteil komprimiert wird
- Compaction erfolgt serverseitig auf Basis der Roh-Chain-of-Thought und bewahrt dadurch den tatsächlichen Arbeitsinhalt besser als eine clientseitige Lösung
- Praxisbeispiel: Während 25 Stunden ununterbrochener Arbeit wurde 13–14 Mal compaction durchgeführt und der Kontext dennoch erfolgreich erhalten
Best Practices fürs Prompting für effektive Delegation
- Ein minimales Prompt sollte ein klares Ziel, Einschränkungen und Kriterien für „fertig“ enthalten
- Validierungsbedingungen in das Prompt einbauen: Erfolgskriterien sowie auszuführende Test- und Build-Befehle angeben
- Offene Prompts nutzen: Codex nach Ideen zur Performance-Verbesserung oder Bereichen mit unzureichender Testabdeckung fragen und so als Denkpartner einsetzen
agents.md — Datei mit Agentenrichtlinien
- Ein offenes Format ähnlich wie Rules in Cursor oder Einstellungen in Windsurf, nicht OpenAI-exklusiv
- Wird in jeder Codex-Sitzung automatisch geladen und trägt zu konsistenten Ergebnissen bei
- Prioritätssystem in 3 Stufen:
- Global (
~/.codex/agents.md): persönliche Standardeinstellungen (teamunabhängig)
- Repository-Root (
agents.md): Konventionen für das gesamte Repository
- Unterverzeichnisse (
agents.md): detaillierte Richtlinien je Microservice/Unterordner
- Codex verkettet (concatenate) die agents.md-Dateien entlang des Pfads vom Projekt-Root bis zum aktuellen Verzeichnis, wobei die spezifischere Datei Vorrang hat
- Empfohlene Inhalte: Repository-Überblick, Ausführungsbefehle, Testerwartungen, Speicherorte zentraler Module, Commit-/PR-Richtlinien
- Mit dem
/init-Befehl (CLI) lässt sich die erste agents.md automatisch erzeugen und damit das Cold-Start-Problem entschärfen
- Empfohlen wird, sie kurz zu halten, unter 100 Zeilen (entsprechend der agents.md in OpenAIs internem Monorepo)
- Wenn der Inhalt länger wird, sollte er in taskbezogene Markdown-Dateien (planning.md, code-review.md, architecture.md usw.) ausgelagert und in agents.md referenziert werden
- Vorgestellt wurde ein Automatisierungsmuster, bei dem Codex lokale Sitzungslogs (Speicherpfad wird bereitgestellt) analysiert und wöchentlich automatisch Verbesserungsvorschläge für agents.md macht
- Ebenso kann man Codex um eine Gesprächsretrospektive bitten, damit eine Gotcha-Sektion oder Hinweise automatisch in agents.md übernommen werden
Abschluss — 3 zentrale Maßnahmen für die Einführung von Codex
- agents.md erstellen und benutzerdefinierte Einstellungen konfigurieren
- Codex echte Arbeitsaufgaben geben und mit den im Alltag genutzten Tools (MCP) verbinden
- Codex nicht nur in der Build-Phase einsetzen, sondern im gesamten Entwicklungszyklus von Design bis Bereitstellung und Wartung kontinuierlich verwenden
3 Kommentare
Auch die OpenAI Academy ist inzwischen fast seit einem Jahr online, sodass sich schon ziemlich viele gute Kurse angesammelt haben.
(Allerdings ist es etwas schade, dass es nur automatisch erzeugte englische Untertitel gibt)
Schade, ich wünschte, es gäbe koreanische Untertitel..
Hat das schon jemand gehört?
Lohnt es sich, dafür eine Stunde zu investieren?
Im Zeitalter der One-Click-AI ist Zeit schließlich kostbar, haha.