Codex für Softwareingenieure

(academy.openai.com)

69 Punkte von GN⁺ 2026-03-19 | 3 Kommentare | Auf WhatsApp teilen

Von OpenAI selbst veröffentlichtes Webinar-Video zu Codex für Entwickler (58 Minuten)
Codex ist eine Coding-Agent-Plattform, die über Codevervollständigung oder Pair Programming hinausgeht und so konzipiert ist, dass Ingenieure umfangreiche Aufgaben an Agenten delegieren können
Codex-App, CLI, IDE-Erweiterungen und weitere verschiedene Interfaces teilen sich dasselbe Backend, und mehrere Aufgaben können parallel gleichzeitig ausgeführt werden
Deckt den gesamten Software Development Lifecycle (SDLC) ab – von Planung (Plan), Design, Build, Test, Review und Dokumentation bis hin zu Bereitstellung und Wartung (Deploy & Maintenance)
Über die Datei agents.md lassen sich Verhaltensrichtlinien für Agenten auf Repository-Ebene festlegen; mit Skills und Automations können wiederkehrende Workflows paketiert und automatisch ausgeführt werden
Unterstützt 25 Stunden unterbrechungsfreie Arbeit und die Aufrechterhaltung von Langzeitkontext durch 13–14 serverseitige Compactions; Sicherheit wird durch Sandboxen auf OS-Ebene gewährleistet

Die Evolution des AI-Codings: von Codevervollständigung zur Agenten-Delegation

In den vergangenen Jahren hat sich AI-Coding von Codevervollständigung (ca. 10 % höhere Tippgeschwindigkeit) über Pair Programming (planen über mehrere Dateien hinweg, Tests ausführen, Repos anpassen) weiterentwickelt
Beide Ansätze konzentrierten sich darauf, einen „besseren Kollaborateur“ zu schaffen, doch bei Codex begann die Entwicklung bereits vor einem Jahr mit dem Ziel, delegierbare Agenten zu bauen
Im Dezember 2025 beseitigte das GT-5.2-Codex-Modell mit langer unterbrechungsfreier Laufzeit und hoher Steuerbarkeit (steerability) die zentrale Hürde für „echte Agenten-Delegation“
Danach wurde die Leistung mit dem schnelleren und effizienteren GT 5.3 sowie dem neuesten GT 5.4 kontinuierlich verbessert
Wichtige Fortschritte sind die stabile Navigation in großen Enterprise-Codebasen und das langfristige Beibehalten der Ausrichtung auf die Nutzerabsicht

Verfügbare Interfaces für Codex

Ein einzelner Codex-Agent kann über mehrere Oberflächen wie CLI, IDE-Erweiterung und Codex-App genutzt werden; alle teilen sich dasselbe Backend
Die Codex-App ist das visuellste Interface für parallele Arbeit und dafür optimiert, mehrere Agenten gleichzeitig auszuführen und deren Ausgaben zu prüfen
Fallbeispiel von Peter Steinberger (Gründer von OpenClaw): Der Wechsel von der Verwaltung von mehr als 10 CLI-Fenstern zur Codex-App verbesserte die Effizienz beim Management paralleler Agenten
Unterstützt macOS und Windows; Download über openai.com/codex, unter Windows auch im Microsoft Store verfügbar
In der CLI erfolgt die erste Anmeldung mit dem Befehl codex login, danach startet eine Sitzung mit codex

Codex-App-UI und Einstellungen

Modellauswahl (z. B. GPT 5.4) und Anpassung des reasoning effort möglich: low, medium, high, extra high
- medium ist der Standardwert und bietet die beste Balance zwischen Geschwindigkeit und Denktiefe
- Für einfache Fragen eignet sich low, für langes tiefes Nachdenken high oder extra high
Mit dem Speed-Modus-Schalter (fast/standard) lässt sich die Antwortgeschwindigkeit steuern
Neben lokaler Arbeit gibt es den Git-worktree-Modus und die Option, entfernte Cloud-Container zu starten
Berechtigungseinstellungen: Wahl zwischen Standardrechten (Dateien im Projekt lesen/bearbeiten, Genehmigung bei riskanten Befehlen anfordern) und Vollzugriff (alle Dateien auf dem Computer, Netzwerkzugriff, Ausführung ohne Genehmigung)
- Für neue Nutzer werden Standardrechte empfohlen
In der linken Seitenleiste können Projekte (Ordner) hinzugefügt und gewechselt werden

Einsatz von Codex in allen Phasen des SDLC

OpenAI hat den Leitfaden „Building an AI Native Engineering Team“ veröffentlicht, der zusammenfasst, wie Coding-Agenten alle 7 SDLC-Phasen beschleunigen: Planung, Design, Build, Test, Review, Dokumentation, Bereitstellung/Wartung
Besonders Test- und Review-Phasen werden mit steigender Codegenerierungsfähigkeit noch wichtiger
Codex wird insbesondere für Schlussfolgerungen in komplexen Codebasen und das Schreiben produktionsreifer Software hoch bewertet

Planungsphase (Plan)

Durch Aktivieren des Plan-Modus (/plan oder Shift+Tab) erstellt Codex vor der Implementierung zunächst einen Plan
In der Demo bat man um einen Plan für eine SwiftUI-iOS-Companion-App; Codex durchsuchte daraufhin die Codebasis und stellte Rückfragen (Authentifizierungsmethode, Umfang des ersten Releases usw.)
Der Agent lässt sich durch Annahme empfohlener Optionen oder durch direkte Eingabe steuern
Annahmen zum Plan werden ausdrücklich genannt, sodass Nutzer sie prüfen und korrigieren können

Designphase — MCP-Integration

Über MCP (Model Context Protocol) kann Kontext aus externen Tools wie Figma oder Linear direkt an Codex angebunden werden
- Unterstützt in CLI, IDE-Erweiterung und Codex-App
Bei der Figma-MCP-Integration ruft Codex den Designkontext ab, wenn ein Design-Link eingefügt wird, und wandelt ihn in Code um
- Ist MCP nicht eingerichtet, zeigt Codex automatisch Installationshinweise an
Auch die Integration der ChatGPT-App ist als von Dritten erstellte Anbindung direkt in Codex nutzbar
Dadurch können Ingenieure sich auf die Kernlogik konzentrieren, während Designer mehr Zeit in die Erkundung von Designkonzepten investieren können

Build-Phase

Die Phase mit dem größten Einfluss von Coding-Agenten im SDLC
In der Demo wurden die Behebung einer N+1-Query-Ineffizienz, das Hinzufügen von Regressionstests, die Prüfung fehlender API-Route-Authentifizierung und die Migration von NextAuth v4 zu Auth.js v5 parallel ausgeführt
Ergebnis der codegenerierung auf Basis eines Figma-Designs: Änderungen in 10 Dateien, 320 Zeilen Code geschrieben, keine manuelle CSS-Arbeit erforderlich
Mit der Worktree-Funktion werden automatisch Kopien des lokalen Projekts erstellt, um Konflikte zwischen parallelen Aufgaben zu vermeiden; ein separates Kopieren des Repositories ist nicht nötig
In agents.md definierte Validierungs-, Build- und Lint-Befehle wie npx tsc oder npm test führt Codex automatisch aus, um die Einhaltung von Teamkonventionen zu prüfen
Der Build selbst ist kein Bottleneck mehr; in Enterprise-Umgebungen ist entscheidend, zu validieren, ob der Code den Teamregeln entspricht
Das Terminal lässt sich mit Command+J direkt in der App öffnen und verwenden
Auch bei iOS-Apps kann xcode build direkt in der Codex-App ausgeführt werden, ohne Xcode selbst zu öffnen

Slash Commands

Slash Commands werden in CLI, IDE-Erweiterung und Codex-App unterstützt: Plan-Modus, File Mentions, Sitzungsstatus prüfen, Berechtigungen ändern usw.
Mit dem Befehl /experimental lassen sich experimentelle Funktionen umschalten
- Einschließlich der Erstellung von Multi-Agenten (Sub-Agents)
- Die CLI erhält neue Funktionen etwas früher als andere Interfaces
In einem Interface umgeschaltete Einstellungen werden wegen des gemeinsamen Backends auf alle Interfaces angewendet

Review-Phase

Mit dem Befehl /review lässt sich ein Code-Review gegen den Basis-Branch oder gegen lokale uncommittete Änderungen ausführen
Codex-Agenten sind speziell darauf trainiert, Bugs der Stufen P0/P1 zu identifizieren, und liefern daher signalstarkes Feedback mit wenig Rauschen
So lassen sich Probleme frühzeitig lokal erkennen, bevor ein PR die CI/CD-Pipeline erreicht
Native GitHub-Cloud-Integration: Codex führt für PRs automatisch proaktive oder reaktive Code-Reviews durch
- Vorgestellt wurde ein Fall, in dem ein P1-Problem entdeckt wurde, das Menschen leicht übersehen, etwa bei der Prüfung von Regex-Regeln
Andere SCMs wie GitLab oder Bitbucket können über das Codex SDK direkt integriert werden
Werden im Diff-Panel direkt Code-Review-Kommentare hinzugefügt, fließen sie automatisch als Kontext in die nächste Unterhaltung ein

Skills — Wiederverwendbare Workflow-Pakete

Ein Skill ist ein offener Standard, der wiederverwendbare Workflow-Anweisungen paketiert, die Codex ausführen kann
- Strukturell ist es ein einzelner Ordner; die Pflichtdatei ist skill.md (Metadaten + Agentenanweisungen)
- Optional können Ausführungsskripte, Dokumentation und Templates ergänzt werden
MCP kann in einen Skill eingebettet werden, um auch externe Tools zu integrieren
Demo-Beispiele: Verarbeitung von PR-Kommentaren, automatische Behebung fehlgeschlagener BuildKite-Builds, Erkennung von Dead Code
Skill Creator (System-Skill): Bei einer Anfrage wie „create a skill to find dead code paths“ wird automatisch ein Gerüst für skill.md erzeugt
Skill Installer (System-Skill): Installiert den erzeugten Skill sofort in das lokale Codex-Skill-Verzeichnis
Werden nach langen Unterhaltungen wiederkehrende Workflows in Skills umgewandelt, lässt sich beim nächsten Mal der gesamte Workflow mit einem einzigen Aufruf ausführen
Beispiel für den GitHub Issue Plan PR Skill: Mit einem Prompt werden GitHub-Issue-Triage, Planung, Bearbeitung, Dokumentation und die Erstellung eines Draft-PRs in einem Durchgang erledigt

Dokumentationsphase

Einer der am meisten unterschätzten Einsatzbereiche von Codex
Unterstützt die Erstellung von Systemdiagrammen und die automatische Aktualisierung von Dokumentation bei Feature-Implementierungen
Vorgestellt wurde eine Demo, in der über Linear MCP Änderungen zu einem bestimmten Ticket, Ergebnisse von Regressionstests und Validierungsdetails automatisch im Linear-Board dokumentiert wurden

Bereitstellung und Wartung (Deploy & Maintenance)

In der Codex-App können Commit, Push und PR-Erstellung per Klick direkt ausgeführt werden (Git-basiert)
Wird ein Stack Trace eingefügt, erschließt Codex die gesamte Codebasis, um die Ursache eines Problems zu finden
Triage Page Skill: Gibt man eine Incident-ID ein, werden Details gesammelt, der Incident bestätigt, Metriken und Logs geprüft und sogar ein Patch in einem Durchgang erstellt
- Die Reaktion auf Pager-Duty-Fälle wird damit von manueller Log-Analyse auf Agenten-Delegation umgestellt
PR Babysitter Skill: Überwacht den Fortschritt der CI/CD-Pipeline eines PR kontinuierlich und behebt Probleme automatisch, bis der PR am Ende vollautomatisch gemergt wird
- Bereits im Einsatz in OpenAIs großem Monorepo-Umfeld
- Kann aus einem Open-Source-Skill-Repository heruntergeladen werden

Automations — Zeitgesteuerte automatische Ausführung

Wer mit Skills vertraut ist, kann mit Automations die automatische Ausführung von Aufgaben zu festgelegten Zeiten konfigurieren
Sentry-Skill-Automatisierung: Findet jeden Donnerstag (oder täglich) Issues in einem bestimmten Repository und schlägt Korrekturen vor oder behebt sie automatisch
„What is everyone up to?“-Automatisierung: Gibt jeden Morgen um 9 Uhr eine Zusammenfassung der Aktivitäten der Teammitglieder im Repository aus
Auch ohne direkte Prompteingabe arbeitet Codex im Hintergrund kontinuierlich weiter

Funktionsweise der Codex-Agenten

Codex-Agenten arbeiten schleifenbasiert: Der Nutzer gibt ein klares Ziel und eine erste Richtung vor → der Agent wiederholt Schlussfolgern, Tool-Aufrufe, Dateilesen, Repository-Suche, Code schreiben und Befehle ausführen
Die Ergebnisse jedes Tools werden an den nächsten Modellaufruf zurückgespielt, sodass sich schrittweise Verständnis und Fortschritt aufbauen
Kontext ist die zentrale Variable für die Leistung des Agenten: Wichtig ist, mit der richtigen Menge Input die richtige Richtung vorzugeben
Sandboxing auf OS-Ebene: keine leichte Einschränkung auf Harness-Ebene, sondern Kontrolle von Netzwerk- und Dateizugriff auf Betriebssystemebene
- Ein Design als Vorsorge dafür, dass Modelle mit wachsender Leistungsfähigkeit leichte Schutzmechanismen umgehen könnten
- Sandbox-Unterstützung auf allen Systemen (Mac, Windows); unter Windows ist eine native Windows-Sandbox implementiert, die sicherer als WSL ist
In der config-TOML-Datei lassen sich Details für approval mode (Zeitpunkt der Genehmigung) und sandbox mode (Zugriffsbereich) festlegen
- Der Standardwert ist „on request“: normal ausführen und nur bei nötiger Rechteerweiterung pausieren

Compaction — Verwaltung lang laufender Threads

Wenn sich eine Unterhaltung dem Kontextlimit des Modells nähert, führt Codex eine Compaction durch, bei der der Anfangsteil komprimiert wird
Compaction erfolgt serverseitig auf Basis der Roh-Chain-of-Thought und bewahrt dadurch den tatsächlichen Arbeitsinhalt besser als eine clientseitige Lösung
Praxisbeispiel: Während 25 Stunden ununterbrochener Arbeit wurde 13–14 Mal compaction durchgeführt und der Kontext dennoch erfolgreich erhalten

Best Practices fürs Prompting für effektive Delegation

Ein minimales Prompt sollte ein klares Ziel, Einschränkungen und Kriterien für „fertig“ enthalten
Validierungsbedingungen in das Prompt einbauen: Erfolgskriterien sowie auszuführende Test- und Build-Befehle angeben
Offene Prompts nutzen: Codex nach Ideen zur Performance-Verbesserung oder Bereichen mit unzureichender Testabdeckung fragen und so als Denkpartner einsetzen

agents.md — Datei mit Agentenrichtlinien

Ein offenes Format ähnlich wie Rules in Cursor oder Einstellungen in Windsurf, nicht OpenAI-exklusiv
Wird in jeder Codex-Sitzung automatisch geladen und trägt zu konsistenten Ergebnissen bei
Prioritätssystem in 3 Stufen:
- Global (~/.codex/agents.md): persönliche Standardeinstellungen (teamunabhängig)
- Repository-Root (agents.md): Konventionen für das gesamte Repository
- Unterverzeichnisse (agents.md): detaillierte Richtlinien je Microservice/Unterordner
- Codex verkettet (concatenate) die agents.md-Dateien entlang des Pfads vom Projekt-Root bis zum aktuellen Verzeichnis, wobei die spezifischere Datei Vorrang hat
Empfohlene Inhalte: Repository-Überblick, Ausführungsbefehle, Testerwartungen, Speicherorte zentraler Module, Commit-/PR-Richtlinien
Mit dem /init-Befehl (CLI) lässt sich die erste agents.md automatisch erzeugen und damit das Cold-Start-Problem entschärfen
Empfohlen wird, sie kurz zu halten, unter 100 Zeilen (entsprechend der agents.md in OpenAIs internem Monorepo)
Wenn der Inhalt länger wird, sollte er in taskbezogene Markdown-Dateien (planning.md, code-review.md, architecture.md usw.) ausgelagert und in agents.md referenziert werden
Vorgestellt wurde ein Automatisierungsmuster, bei dem Codex lokale Sitzungslogs (Speicherpfad wird bereitgestellt) analysiert und wöchentlich automatisch Verbesserungsvorschläge für agents.md macht
Ebenso kann man Codex um eine Gesprächsretrospektive bitten, damit eine Gotcha-Sektion oder Hinweise automatisch in agents.md übernommen werden

Abschluss — 3 zentrale Maßnahmen für die Einführung von Codex

agents.md erstellen und benutzerdefinierte Einstellungen konfigurieren
Codex echte Arbeitsaufgaben geben und mit den im Alltag genutzten Tools (MCP) verbinden
Codex nicht nur in der Build-Phase einsetzen, sondern im gesamten Entwicklungszyklus von Design bis Bereitstellung und Wartung kontinuierlich verwenden

3 Kommentare

xguru 2026-03-19

Auch die OpenAI Academy ist inzwischen fast seit einem Jahr online, sodass sich schon ziemlich viele gute Kurse angesammelt haben.
(Allerdings ist es etwas schade, dass es nur automatisch erzeugte englische Untertitel gibt)

mindok 2026-03-20

Schade, ich wünschte, es gäbe koreanische Untertitel..

j2sus91 2026-03-19

Hat das schon jemand gehört?
Lohnt es sich, dafür eine Stunde zu investieren?

Im Zeitalter der One-Click-AI ist Zeit schließlich kostbar, haha.