- Verwaltet mehrere KI-Agenten gleichzeitig und unterstützt parallele Arbeit sowie langfristige Zusammenarbeit in einer integrierten Entwicklungsumgebung für KI-Entwicklung
- Jeder Agent läuft in einem eigenen Thread, wodurch projektbezogenes Multitasking, Code-Reviews, Diff-Kommentare und manuelle Korrekturen möglich sind
- Mit der Funktion Skills lässt sich der Einsatz über das Schreiben von Code hinaus auf Informationsbeschaffung, Problemlösung, Bilderzeugung, Dokumentenerstellung, Cloud-Deployment und weitere Aufgaben ausweiten
- Mit der Funktion Automations können wiederkehrende Aufgaben automatisch im Hintergrund nach einem festgelegten Zeitplan ausgeführt werden
- Standardmäßig ist Sandbox-Sicherheit aktiviert; Befehle mit höheren Rechten wie Netzwerkzugriff erfordern die Zustimmung des Nutzers
- Codex ist vorübergehend auch für ChatGPT-Free- und Go-Nutzer verfügbar; bei kostenpflichtigen Plänen wird das Nutzungslimit verdoppelt
Überblick über die Codex-App: Kommandozentrale für Agenten
- Seit der Einführung von Codex im April 2025 hat sich die Art und Weise, wie Entwickler Agenten einsetzen, grundlegend verändert
- Modelle können nun komplexe, langfristige Aufgaben von Anfang bis Ende bearbeiten
- Entwickler koordinieren jetzt mehrere Agenten über das gesamte Projekt hinweg, delegieren Aufgaben und führen sie parallel aus
- Die zentrale Frage hat sich von „Was können Agenten tun?“ hin zu „Wie können Menschen Agenten im großen Maßstab steuern, überwachen und gemeinsam mit ihnen arbeiten?“ verlagert
- Bestehende IDEs und terminalbasierte Tools wurden nicht für diese Arbeitsweise entwickelt, daher wird ein neues Werkzeug benötigt
- Die Codex-App für macOS kann mehrere KI-Agenten gleichzeitig verwalten und Aufgaben parallel ausführen
- Sie unterstützt lang laufende Aufgaben und verwaltet durch die Zusammenarbeit mehrerer Agenten den gesamten Software-Lebenszyklus von Design, Entwicklung und Deployment bis zur Wartung
Paralleles Arbeiten mit mehreren Agenten
- Die Codex-App bietet einen fokussierten Arbeitsraum für Multitasking mit Agenten
- Agenten laufen in separaten, projektbezogenen Threads, sodass sich ohne Kontextverlust zwischen Aufgaben wechseln lässt
- Innerhalb eines Threads lassen sich Änderungen des Agenten prüfen, Diff-Kommentare hinzufügen oder direkt im Editor anpassen
- Dank integrierter Worktree-Unterstützung können mehrere Agenten im selben Repository ohne Konflikte arbeiten
- Jeder Agent arbeitet auf einer isolierten Kopie des Codes und kann so verschiedene Wege erkunden, ohne den lokalen Git-Status zu beeinflussen
- Änderungen aus der Agentenarbeit können lokal ausgecheckt werden, oder die Arbeit läuft weiter, ohne den lokalen Git-Status zu verändern
- Sitzungsverlauf und Einstellungen aus Codex CLI und der IDE-Erweiterung werden automatisch übernommen, sodass bestehende Projekte sofort weiterverwendet werden können
Skills: Erweiterung über die Code-Generierung hinaus
- Codex entwickelt sich von einem Agenten, der Code schreibt, zu einem Agenten, der mithilfe von Code Aufgaben auf dem Computer ausführt
- Mit Skills lässt sich der Einsatz über die Code-Generierung hinaus auf Aufgaben wie Informationsbeschaffung und -synthese, Problemlösung und Schreiben erweitern
- Anweisungen, Ressourcen und Skripte werden gebündelt, damit Codex sich mit Tools verbinden und Workflows ausführen kann
- Aufgaben lassen sich entsprechend den Präferenzen des Teams zuverlässig abschließen
- Die Codex-App enthält eine eigene Oberfläche zum Erstellen und Verwalten von Skills
- Bestimmte Skills können ausdrücklich angefordert oder je nach Aufgabe automatisch verwendet werden
-
Beispiel für den Einsatz von Skills: Erstellung eines Rennspiels
- Codex wurde beauftragt, ein Rennspiel mit verschiedenen Fahrern, 8 Karten und per Leertaste einsetzbaren Items zu erstellen
- Dafür wurden ein Bildgenerierungs-Skill (auf Basis von GPT Image) und ein Skill für die Entwicklung von Webspielen genutzt
- Mit einem einzigen anfänglichen Prompt arbeitete Codex über 7 Millionen Token hinweg selbstständig und stellte das Spiel fertig
- Es übernahm die Rollen von Designer, Spieleentwickler und QA-Tester und verifizierte das Spiel durch tatsächliches Spielen
- Spielname: Voxel Velocity, ein 3D-Voxel-Kartracer mit Three.js
- Einzelrennen-Modus (immer 3 Runden, 1 Mensch gegen 7 CPU-Gegner, 8 Strecken sofort verfügbar)
- Arcade-Fahrmodell, Drift-Ladesystem, Boost-Stufen (Tier 1 0,7 Sekunden, Tier 2 1,1 Sekunden, Tier 3 1,5 Sekunden)
- 8 Charaktere, 8 Items, CPU-Schwierigkeits-Presets, AI-Spline-Implementierung
-
Wichtige verfügbare Skills
- Implement designs: Holt Design-Kontext, Assets und Screenshots aus Figma und wandelt sie in produktionsreifen UI-Code mit 1:1 visueller Übereinstimmung um
- Manage projects: Klassifiziert Bugs in Linear, verfolgt Releases und verwaltet die Team-Auslastung
- Deploy to the cloud: Stellt Web-Apps bei gängigen Cloud-Hosts wie Cloudflare, Netlify, Render und Vercel bereit
- Generate images: Erzeugt und bearbeitet Bilder für Websites, UI-Mockups, Produktvisualisierungen und Game-Assets mit einem Bildgenerierungs-Skill auf Basis von GPT Image
- Build with OpenAI APIs: Nutzt beim Entwickeln mit der OpenAI API die neueste Dokumentation
- Create documents: Liest, erstellt und bearbeitet PDF-, Tabellen- und docx-Dateien (mit Unterstützung für professionelle Formatierung und Layouts)
- Neu erstellte Skills in der App können in App, CLI und IDE-Erweiterung überall verwendet werden
- Skills können ins Repository eingecheckt und so mit dem gesamten Team geteilt werden
Automations: Wiederkehrende Aufgaben automatisieren
- Mit der Funktion Automations führt Codex Aufgaben im Hintergrund automatisch nach einem definierten Zeitplan aus
- Die Einrichtung kombiniert Anweisungen mit optionalen Skills
- Nach Abschluss werden die Ergebnisse in einer Review-Warteschlange gespeichert, sodass bei Bedarf weitergearbeitet werden kann
- Beispiele aus dem internen Einsatz bei OpenAI
- Tägliche Issue-Klassifizierung
- Finden und Zusammenfassen von CI-Fehlern
- Erstellung täglicher Release-Briefings
- Verifikation von Bugs
Personality: Arbeitsstil anpassen
- Entwickler haben unterschiedliche Vorlieben bei der Zusammenarbeit mit Agenten
- Manche wünschen sich einen knappen, umsetzungsorientierten Partner
- Andere bevorzugen eine dialogorientiertere und empathischere Interaktion
- In Codex stehen zwei Persönlichkeiten zur Auswahl: ein knapper, pragmatischer Stil oder ein dialogorientierter, empathischer Stil
- Die Funktionalität ändert sich nicht, nur die Art der Interaktion wird an die Vorlieben angepasst
- Einstellbar in App, CLI und IDE-Erweiterung mit dem Befehl /personality
Sicherheit: standardmäßig aktiv und konfigurierbar
- Sicherheit ist im gesamten Codex-Agenten-Stack von Anfang an ins Design integriert
- Wie bei Codex CLI wird natives, Open-Source- und konfigurierbares Sandboxing auf Systemebene verwendet
- Standardeinstellungen
- Agenten dürfen nur Dateien im aktuell bearbeiteten Ordner oder Branch bearbeiten sowie zwischengespeicherte Websuchen nutzen
- Für Befehle mit höheren Rechten wie Netzwerkzugriff wird die Zustimmung des Nutzers angefordert
- Es lassen sich projekt- oder teambezogene Regeln festlegen, damit bestimmte Befehle automatisch mit erhöhten Rechten ausgeführt werden
Verfügbarkeit und Preise
- Die Codex-App ist ab heute für macOS verfügbar
- Abonnenten von ChatGPT Plus, Pro, Business, Enterprise und Edu können Codex nach dem ChatGPT-Login in CLI, Web, IDE-Erweiterung und App verwenden
- Die Nutzung ist im ChatGPT-Abonnement enthalten; bei Bedarf können zusätzliche Credits gekauft werden
- Vorübergehend ist Codex auch für ChatGPT-Free- und Go-Nutzer verfügbar
- Während dieses Zeitraums wird für bestehende Codex-Nutzer aller kostenpflichtigen Pläne das Nutzungslimit verdoppelt
Ausblick
- Seit der Veröffentlichung von GPT-5.2-Codex Mitte Dezember 2024 hat sich die gesamte Codex-Nutzung verdoppelt
- Im vergangenen Monat haben mehr als 1 Million Entwickler Codex genutzt
- Geplante nächste Schritte
- Eine Windows-App ist geplant
- Die Grenzen der Modellfähigkeiten sollen weiter ausgebaut werden
- Schnellere Inferenz soll bereitgestellt werden
- Verbesserungen in der App
- MultiaAgenten-Workflows werden auf Basis realer Rückmeldungen kontinuierlich verbessert
- Die Verwaltung paralleler Arbeit und das Beibehalten von Kontext beim Wechsel zwischen Agenten sollen erleichtert werden
- Ausbau von Automations
- Unterstützung für Cloud-basierte Trigger befindet sich im Aufbau
- Dadurch kann Codex im Hintergrund weiterlaufen, auch wenn der Computer nicht geöffnet ist
Die Kernannahme von Codex
- Sie basiert auf der einfachen Annahme, dass sich alles per Code steuern lässt
- Je besser ein Agent über Code nachdenken und ihn erzeugen kann, desto kompetenter wird er bei allen Formen technischer und wissensbasierter Arbeit
- Die aktuelle Kernherausforderung ist die Lücke zwischen den Fähigkeiten von Frontier-Modellen und dem Maß, in dem Menschen sie tatsächlich einfach nutzen können
- Codex wurde entwickelt, um diese Lücke zu schließen, indem sich die gesamte Intelligenz des Modells leicht auf reale Aufgaben ausrichten, überwachen und anwenden lässt
- Der Fokus lag auf dem Aufbau des besten Coding-Agenten; dies soll die Grundlage für leistungsfähige Agenten für weitreichende Wissensarbeit über das reine Schreiben von Code hinaus bilden
Noch keine Kommentare.