Codex erweitert Sammlung von Anwendungsfällen deutlich
(developers.openai.com)- OpenAI hat die Seite mit den Anwendungsfällen von Codex umfassend überarbeitet und von bisher 12 auf 52 Use Cases erweitert.
- Die Positionierung verschiebt sich damit von einer reinen Programmierhilfe hin zu einer Plattform, an die unternehmensweite Teams Aufgaben delegieren können – darunter Engineering, Design, Daten, Finanzen, Operations, QA und Sales.
- Von Computer Use (Mac-Automatisierung), Gmail-Posteingangsverwaltung, Slack, Zoom, Dokumenten und Spreadsheets über Finanzmodellierung (DCF, Cashflow, Budget), native iOS/macOS-Entwicklung, Sales- und Marketing-Workflows, QA, Automatisierung, Deployment, Evals bis zur ChatGPT-App: Die Beispiele sind als reale Arbeitsabläufe aufbereitet, die an Codex übergeben werden.
1. Codex als Arbeitskollegen einrichten (Automation / Integrations)
Schwierigkeitsgrad: Easy | Dauer: Long-running
- Tools, in denen die Arbeit tatsächlich stattfindet – etwa Slack, Gmail, Calendar, Notion, GitHub, Linear oder lokale Notizen – werden in einem Codex-Thread verbunden, sodass es wie ein „Kollege mit Kenntnis meines Arbeitskontexts“ genutzt werden kann.
- Beim ersten Durchlauf lässt man Codex wichtige, leicht übersehene Anfragen, geänderte Dokumente, untergegangene Entscheidungen und blockierte Handoffs aufspüren; der Nutzer gibt dann Feedback dazu, was nützlich ist und was nur Rauschen erzeugt.
- Anschließend kann auf denselben Thread Automatisierung gelegt werden, damit der Kontext regelmäßig geprüft wird. Entscheidungen, die Urteilsvermögen erfordern, soll Codex nicht eigenmächtig treffen, sondern dem Nutzer vorlegen.
- Geeignet für: Einzelpersonen, Operators, Manager, PMs und Engineers, die über viele Tools verteilten Arbeitskontext laufend nachverfolgen müssen.
2. Feedback in Aktionen umsetzen (Data / Integrations)
Schwierigkeitsgrad: Easy | Dauer: 30m
- Feedback aus verschiedenen Quellen – etwa Slack-Kanälen, GitHub-/Linear-Issues, Umfrage-CSV-Dateien, Notizen aus Kundeninterviews oder Google-Drive-Dokumenten – wird gesammelt und in ein prüfbares Ergebnis in Form eines Google Sheets oder Google Docs überführt.
- Codex bündelt Feedback nach Themen, Beleg-Links, Folgefragen und zugewiesenen Aktionen; geprüfte Inhalte können anschließend in Slack-Updates oder Issue-Entwürfe überführt werden.
- Wenn sich die Feedback-Quellen laufend ändern, kann im selben Thread Automatisierung eingerichtet werden, sodass nur neue Themen oder Punkte mit stärkerer Beleglage gemeldet werden.
- Geeignet für: Teams, die Beta-Feedback, Customer VOC, Issue-Threads oder Research-Notizen in Produktmaßnahmen überführen müssen.
3. Unordentliche Daten bereinigen und vorbereiten (Data / Knowledge Work)
Schwierigkeitsgrad: Easy | Dauer: 5m
- Wenn in CSV-Dateien oder Spreadsheets gemischte Datumsformate, Währungsstrings, doppelte Zeilen, leere Werte, Summenzeilen oder Aliase enthalten sind, lässt sich unter Beibehaltung des Originals eine bereinigte Kopie erzeugen.
- Der Nutzer gibt klar an, welche Probleme bereits sichtbar sind und welches Zielformat gewünscht ist, zum Beispiel eine bereinigte CSV, eine Datei zum Hochladen oder ein neuer Sheet-Tab.
- Codex hinterlässt zusammen mit der bereinigten Datei auch Hinweise zur Datenqualität, damit diese vor einer Analyse oder einem Upload noch von Menschen geprüft werden können.
- Geeignet für: Teams, die aus verschiedenen Systemen erhaltene Datendateien für Analysen oder die Eingabe in operative Systeme aufbereiten müssen.
4. Tabellarische Daten abfragen (Data / Knowledge Work)
Schwierigkeitsgrad: Easy | Dauer: 30m
- Stellt man Fragen zu CSV-Dateien, Spreadsheets, Dashboard-Exports, Google Sheets oder lokalen Datendateien, prüft Codex die Spalten und führt Berechnungen, Aggregationen sowie die Erstellung von Diagrammen aus.
- Empfohlen wird ein Ablauf, der nicht bei einer einfachen Antwort endet, sondern HTML-basierte Browser-Visualisierungen erzeugt, die sich direkt in der Codex-App öffnen lassen.
- Nach einer ersten Analyse können im selben Thread Folgeanalysen zu Regionen, Kohorten, Produkten, Kalenderwochen, Modellversionen oder Kundensegmenten angestoßen werden.
- Geeignet für: datengetriebene Arbeit, bei der schnelle Berechnungen, einfache Diagramme oder Zusammenfassungen für Meetings benötigt werden.
5. GitHub Pull Requests reviewen (Integrations / Workflow)
Schwierigkeitsgrad: Easy | Dauer: 5s
- Codex Code Review kann mit einer GitHub-Organisation oder einem Repository verbunden werden, um für jeden PR automatische Reviews zu erhalten oder per PR-Kommentar manuell ein Review anzufordern.
- Der Fokus liegt darauf, zusätzliche Prüfsignale für Punkte zu erhalten, die Menschen leicht übersehen – etwa Sicherheitsregressionen, fehlende Tests, riskante Verhaltensänderungen oder fehlende Dokumentation.
- Wenn in
AGENTS.mdReview-Prioritäten und dateispezifische Regeln hinterlegt werden, lassen sich die Review-Kriterien von Codex an das jeweilige Repository anpassen. - Geeignet für: Teams, die vor dem Merge zusätzliche Prüfsignale brauchen, sowie für große Codebases im laufenden Betrieb.
6. Den Posteingang verwalten (Automation / Integrations)
Schwierigkeitsgrad: Easy | Dauer: 5m
- Durch die Verbindung mit Gmail lassen sich E-Mails finden, die eine Antwort benötigen; auf Basis kürzlich gesendeter Mails oder freigegebener Schreibbeispiele erstellt Codex Antwortentwürfe im Ton des Nutzers.
- Reicht der Kontext aus den E-Mails allein nicht aus, kann Codex in Arbeitstools wie Slack, Google Drive oder Projektnotizen nach aktuellen Entscheidungen, Verantwortlichen, Dateien oder Blockern suchen.
- Der erste Durchlauf sollte als Kalibrierung betrachtet werden: Man gibt Feedback dazu, welche Mails ignoriert werden sollen und welcher Ton passt, und entwickelt daraus anschließend eine regelmäßige Automatisierung.
- Geeignet für: Menschen, die das Sortieren des Posteingangs und das Erstellen von Antwortentwürfen wiederholt bearbeiten möchten.
7. Responsives Frontend-Design umsetzen (Front-end / Design)
Schwierigkeitsgrad: Intermediate | Dauer: 1h
- Screenshots, Design-Briefs und Referenzbilder werden als Input genutzt und in responsive UI umgesetzt, die Design-System, Tokens und Komponenten eines bestehenden Repositorys wiederverwendet.
- Codex öffnet mit Playwright einen echten Browser und vergleicht die Umsetzung an Desktop- und Mobile-Breakpoints mit der Referenz, um sie iterativ zu verbessern.
- Bei unklaren Punkten empfiehlt es sich, Codex anzuweisen, statt eines neuen Design-Systems die einfachste Umsetzung im Rahmen vorhandener Muster zu wählen und getroffene Annahmen explizit zu machen.
- Geeignet für: die Umsetzung neuer Frontend-Screens und das Einfügen gestalteter Screens in bestehende Apps.
8. Eine große Codebase verstehen (Engineering / Analysis)
Schwierigkeitsgrad: Easy | Dauer: 5m
- Beim Einstieg in ein unbekanntes Repository oder einen fremden Funktionsbereich kann man Codex den Request-Flow, Verantwortlichkeiten der Module, Orte der Datenvalidierung, Nebenwirkungen und als Nächstes zu lesende Dateien erklären lassen.
- Praktischere Erklärungen erhält man meist, wenn statt einer pauschalen Gesamtzusammenfassung ein konkreter Systembereich angegeben wird.
- Empfohlen wird ein Ablauf mit Folgefragen zu Orten der Business-Logik, Validierungsstellen, leicht zu übersehenden Hintergrundjobs und Tests, die nach Änderungen ausgeführt werden sollten.
- Geeignet für: das Onboarding neuer Engineers und Entwickler, die vor einer Funktionsänderung den Codefluss schnell erfassen müssen.
9. Eine Mac-App-Shell erstellen (macOS / Code)
Schwierigkeitsgrad: Advanced | Dauer: 1h
- Mit dem Plugin Build macOS Apps wird eine Mac-native SwiftUI-App-Shell erstellt und eine auf
NavigationSplitViewbasierende Struktur aus Sidebar, Detail-Panel und Inspector aufgebaut. - Es wird empfohlen, Menüs, Toolbar, Tastenkürzel und eine Settings-Scene früh so zu entwerfen, dass sie sich für Desktop-Apps natürlich anfühlen.
- Ziel ist keine bloß hochskalierte iPad- oder Web-App, sondern eine Mac-App-Struktur, in der Fenster, Auswahlzustand, Befehle und Einstellungen stabil funktionieren.
- Geeignet für: Mac-Apps wie Editoren, Bibliotheken, Admin-Tools oder Review-Tools, die Sidebar und Inspector benötigen.
10. Mit Codex meinen Computer bedienen (Knowledge Work / Workflow)
Schwierigkeitsgrad: Easy | Dauer: 5m
- Mit Computer Use kann Codex Mac-Apps direkt sehen, klicken und Eingaben machen und dabei Aufgaben über mehrere Apps und Fenster hinweg ausführen.
- Das eignet sich gut für Abläufe in normalen App-UIs ohne dediziertes Plugin, etwa um Informationen aus Notes zu holen und in ein anderes System einzugeben oder Inhalte in Messages zu prüfen und Antworten zu verfassen.
- Anfragen beginnen mit
@Computer, und es ist sinnvoll, das gewünschte Ergebnis sowie riskante Aktionen, bei denen angehalten werden soll, mit anzugeben. - Geeignet für: wiederkehrende Aufgaben, die nur innerhalb von App-UIs möglich sind, sowie Wissensarbeit über mehrere Fenster und Dateien hinweg
11. Bug-Triage automatisieren (Automation / Quality)
Schwierigkeit: Intermediate | Dauer: 1h
- Codex lässt sich durch Orte navigieren, an denen Bug-Signale zusammenlaufen, etwa Sentry-Benachrichtigungen, Slack-Threads, Linear-/GitHub-Issues, PR-Fehlerschranken, Logs und Support-Tickets.
- Zunächst wird per manuellem Sweep eine Kandidatenliste erstellt, dann wird im selben Thread nachjustiert, welche Einträge nützlich sind, bevor auf regelmäßige Automatisierung umgestellt wird.
- Wenn das System ausreichend vertrauenswürdig ist, kann Codex sogar Entwürfe für Linear-Issues, Slack-Updates, GitHub-Kommentare und Handoff-Notizen erstellen.
- Geeignet für: Produkt- und Engineering-Teams, die täglich über mehrere Tools verteilte Bug-Reports priorisieren müssen
12. Slide-Decks erstellen (Data / Integrations)
Schwierigkeit: Easy | Dauer: 30m
- Codex bearbeitet PowerPoint-Dateien direkt per Code und kombiniert dies mit Bilderzeugung, um bestehende Decks zu aktualisieren oder neue Decks zu erstellen.
- Dabei werden Regeln vor der Auslieferung festgelegt, etwa Logo-Positionen, Text-/Bildanordnung auf bestimmten Folien, Beibehaltung bestehender Branding-Vorgaben sowie Prüfung auf Overflow und Font-Ersetzungen.
- Es wird empfohlen, die Folien als editierbare
.pptxzu belassen; wiederholbare Layout-Regeln kann Codex dabei pro Folie anwenden. - Geeignet für: Teams, die strukturierte Eingaben oder Notizen in Präsentationsmaterial umwandeln, sowie Arbeiten, bei denen bestehende Decks in größerem Umfang angepasst werden müssen
13. Coding-Aufgaben in Slack starten (Integrations / Workflow)
Schwierigkeit: Easy | Dauer: 5m
- Nach der Installation der Slack-App und dem Verbinden von Repository und Umgebung kann per Erwähnung von
@Codexim Thread eine Coding-Aufgabe gestartet werden. - Wenn der Thread genügend Informationen zu Anfrage, Einschränkungen und gewünschtem Ergebnis enthält, führt Codex auf Basis dieses Kontexts einen Cloud-Task aus.
- Über den Ergebnislink lässt sich das Resultat prüfen, und zusätzliche Anpassungen können bei Bedarf im selben Slack-Thread fortgeführt werden.
- Geeignet für: Teams, die direkt aus Slack-Diskussionen heraus Issue-Triage, Bugfixes oder kleine Implementierungsaufgaben übergeben möchten
14. Kleine UI-Änderungen schnell iterieren (Front-end / Design)
Schwierigkeit: Easy | Dauer: 5m
- Wenn die Struktur einer bestehenden App bereits steht, lassen sich kleine UI-Änderungen wie Spacing, Alignment, Farbe, Copy, responsives Verhalten oder States schnell einzeln umsetzen.
- Empfohlen wird eine Schleife wie bei Codex-Spark mit einem schnellen Modell: „eine visuelle Notiz auf einmal, eine kleine Änderung auf einmal, eine Browser-Prüfung auf einmal“.
- Dabei soll der Änderungsumfang präzise festgelegt und verlangt werden, dass bestehende Komponenten, Tokens, Layout-Primitives und Datenflüsse erhalten bleiben.
- Geeignet für: feingranulare UI-Korrekturen aus Design-Reviews sowie Änderungen, die direkt in einer Produkt-Review-Runde umgesetzt werden sollen
15. Onboarding neuer Mitarbeitender koordinieren (Integrations / Data)
Schwierigkeit: Intermediate | Dauer: 30m
- Aus genehmigten Listen neuer Mitarbeitender, Onboarding-Trackern, Manager-/Team-Mappings, dem Status von Hardware- und Account-Vorbereitung sowie Kalender-Meilensteinen wird ein prüfbares Onboarding-Paket erstellt.
- Empfohlen wird, den ersten Durchlauf schreibgeschützt zu halten und echte Einladungen, DMs, E-Mails, Channel-Erstellungen und System-Updates erst nach Prüfung explizit zu genehmigen.
- Dabei können auch Team-Zusammenfassungen, Lücken im Vorbereitungsstand, Namen für Willkommensräume, Einladungslisten, Checklisten für die erste Woche und Ankündigungsentwürfe vorbereitet werden.
- Geeignet für: People, Recruiting, IT, Workplace Operations und Manager, die neue Mitarbeitende aufnehmen
16. Ein neues Konzept lernen (Knowledge Work / Data)
Schwierigkeit: Intermediate | Dauer: 30m
- Codex kann dichte Materialien wie Papers, Vorlesungsunterlagen oder lange Dokumente lesen und Problemstellung, Beitrag, Methode, Experimente, Grenzen und Vorwissen strukturieren.
- Mit Subagents lassen sich Rollen wie das Erfassen der Dokumentstruktur, Recherche zu Vorwissen, Analyse von Abbildungen/Formeln und das Schreiben des Abschlussberichts aufteilen.
- Als Ergebnis eignen sich Formen, die später erneut geprüft werden können, etwa Markdown-Berichte, Mermaid-Diagramme, Concept Maps oder Claim-to-Evidence-Tabellen.
- Geeignet für: Menschen, die sich schnell in ein unbekanntes Forschungsfeld, komplexe technische Konzepte oder lange Kursmaterialien einarbeiten müssen
17. API-Integrationen upgraden (Evaluation / Engineering)
Schwierigkeit: Intermediate | Dauer: 1h
- Bestehende OpenAI-API-Integrationen werden auf die neuesten empfohlenen Modelle und API-Funktionen umgestellt, wobei Verhaltensgleichheit und Regressionsprüfung gemeinsam sichergestellt werden.
- Es geht nicht nur darum, Modellnamen auszutauschen; stattdessen werden zuerst aktuelle Endpoints, Tool-Annahmen, Antwortformate, Prompts und Evaluationspfade inventarisiert.
- Empfohlen wird ein Ablauf, bei dem mit
openai-docsdie neuesten Modell-/Prompt-Guides geprüft und Änderungen vor und nach der Umstellung mit einer Eval-Pipeline wie Promptfoo verifiziert werden. - Geeignet für: Produkte mit älteren Modellen/Endpoints sowie Teams, die beim Modell-Upgrade Regressionstests benötigen
18. Eine App oder Website deployen (Front-end / Integrations)
Schwierigkeit: Intermediate | Dauer: 30m
- Auf Basis von Repository, Screenshots, Design-Briefing, Produktidee, API-Dokumentation und Datenquellen kann Codex eine Web-App erstellen oder anpassen und bis zu einer Vercel-Preview-URL deployen.
- Entscheidend ist, vor dem Deployment Projektprüfung, Build/Tests, Analyse von Fehler-Logs und Validierung der Preview ausführen zu lassen.
- Auch nach dem Deployment können im selben Thread Anpassungen wie Mobile-Layout-Korrekturen, Einbindung aktueller Daten oder Fixes für fehlgeschlagene Build-Logs fortgeführt werden.
- Geeignet für: Teams, die Ideen oder Designs schnell als teilbare Web-Preview umsetzen möchten
19. Figma-Designs in Code umsetzen (Front-end / Design)
Schwierigkeit: Intermediate | Dauer: 1h
- Über den Figma-MCP-Server werden Designkontext, Variablen, Assets und Varianten exakter Knoten geholt und anschließend passend zum Designsystem des bestehenden Repositorys in Code übersetzt.
- Empfohlen wird ein Vorgehen mit
get_design_contextund bei Bedarf anschließendget_metadataundget_screenshot, um Struktur und Referenzen zu sichern und dann mit der Implementierung zu beginnen. - Mit Playwright wird das Umsetzungsergebnis im Browser mit der Figma-Referenz verglichen, während Unterschiede bei responsivem Verhalten und Interaktionen iterativ korrigiert werden.
- Geeignet für: Design- und Frontend-Teams, die in Figma fertig ausgearbeitete Screens oder Flows in eine bestehende Codebase implementieren müssen
20. App-QA mit Computer Use durchführen (Automation / Quality)
Schwierigkeit: Intermediate | Dauer: 30m
- Computer Use sieht die tatsächliche Benutzeroberfläche, klickt, gibt Eingaben ein, scrollt, führt zentrale User Flows aus und protokolliert Stellen, an denen Fehler auftreten
- Dabei sollten Umgebung, die zu testenden Kern-Flows, das Format des Bug-Reports, Schweregrad-Kriterien, Reproduktionsschritte sowie erwartete/tatsächliche Ergebnisse klar vorgegeben werden
- Es kann sowohl Funktionsfehler als auch UI-Probleme erfassen; die Ergebnisse werden in Form einer Triage Summary aufbereitet, die sich an QA-Reports oder an Engineer übergeben lässt
- Geeignet für: Validierung zentraler Flows vor dem Release, Teams, die manuelle QA strukturieren möchten
21. Datensätze analysieren und Reports erstellen (Data / Analysis)
Schwierigkeitsgrad: Intermediate | Dauer: 1h
- Lädt unaufgeräumte Datendateien, bereinigt sie, führt Joins, explorative Analysen, Visualisierungen und Modellierung durch und verpackt das Ergebnis als Berichte oder Dashboards für Entscheidungen
- Wichtig ist, Codex zunächst die Python-Umgebung des Projekts, den Package Manager, den Ausgabeordner und die Skriptkonventionen verstehen zu lassen
- Wiederkehrende Notebook-Bereinigung, Spreadsheet-Export und das Packaging des finalen Reports lassen sich als reusable Skill auslagern, damit derselbe Analyse-Workflow leicht wiederverwendet werden kann
- Geeignet für: Analysten/Produktteams, die reproduzierbare Analyseartefakte von der Datenbereinigung über Charts und Memos bis zum Bericht benötigen
22. Aufgaben aus Nachrichten erledigen (Knowledge Work / Integrations)
Schwierigkeitsgrad: Easy | Dauer: 5m
- Computer Use findet und erledigt verborgene To-dos in Messages-Threads, etwa Buchungen, Recherchen, Terminabstimmungen, Belegeinreichungen oder das Zusammentragen von Informationen
- Bestimmte Absender oder Threads können vorgegeben werden, und nach Abschluss der Aufgabe kann ein Entwurf für eine Antwort im ursprünglichen Nachrichten-Thread erstellt werden
- Bei schwer rückgängig zu machenden Aktionen wie Zahlungen, Bestellungen oder Buchungsbestätigungen ist es wichtig anzuweisen, unbedingt anzuhalten und eine Freigabe einzuholen
- Geeignet für: Personen, die kleine umsetzbare Aufgaben aus persönlichen Nachrichten nicht übersehen und zuverlässig erledigen möchten
23. Aus einer Idee ein PoC machen (Front-end / Engineering)
Schwierigkeitsgrad: Intermediate | Dauer: 1h
- Mit GPT Image/ImageGen wird zunächst ein hochwertiges UI-Mockup erstellt, um die visuelle Richtung festzulegen; auf Basis dieses Mockups wird dann mit Build Web Apps oder dem Game Studio Plugin ein funktionsfähiger Prototyp umgesetzt
- Geeignet für frühe Produktideen, bei denen ein tatsächlich anklickbarer PoC mehr Antworten liefert als eine reine Dokumentationsplanung
- Bilder, die schließlich umgesetzt werden sollen, hängt man am besten in einem neuen Turn an, damit Codex sie direkt als Referenz nutzen kann
- Geeignet für: Teams, die Dashboards, Tools, Web-Apps oder Spielideen schnell visualisieren und validieren möchten
24. Browserbasierte Spiele erstellen (Engineering / Code)
Schwierigkeitsgrad: Intermediate | Dauer: Long-running
- Statt direkt vom Game Brief ins Coding zu gehen, lässt man zuerst eine
PLAN.mderstellen, die Spielerziel, Main Loop, Steuerung, Sieg-/Niederlagebedingungen, Rendering und Asset-Planung enthält - Mit ImageGen werden Concept Art, Sprites, Hintergründe und UI-Assets erzeugt; mit Playwright werden Spielgefühl und Bildschirminhalt im echten Browser getestet und iterativ verbessert
- Spiele müssen fortlaufend bei Code, UI, Assets, Balancing und Deployment überprüft werden, weshalb dies gut zu den langfristigen iterativen Aufgaben von Codex passt
- Geeignet für: Arbeiten, bei denen ein Browserspiel von Grund auf erstellt oder das Bediengefühl und die Visuals eines Prototyps iterativ validiert werden müssen
25. Schwierige Probleme iterativ verbessern (Engineering / Analysis)
Schwierigkeitsgrad: Advanced | Dauer: Long-running
- Es werden ein klares Bewertungssystem, Score-Skripte und überprüfbare Artefakte bereitgestellt, damit Codex eine scorebasierte Verbesserungsschleife ausführen kann
- Dabei werden deterministic checks und LLM-as-a-judge-Bewertungen gemeinsam verwendet, und es werden Stopping Rules für Overall Score und Judge Average festgelegt
- Die Struktur sieht vor, dass Codex in jeder Iteration die aktuelle Ausgabe prüft, die Bewertung misst, genau eine Verbesserung anwendet, erneut evaluiert und Logs schreibt
- Geeignet für: Optimierungsprobleme, die nicht in einem Durchgang gelöst sind, sowie Aufgaben, bei denen visuelle oder subjektive Qualität mehrfach verbessert werden muss
26. Workflows als Skill speichern (Engineering / Workflow)
Schwierigkeitsgrad: Easy | Dauer: 5m
- Gut funktionierende Codex-Threads, Review-Regeln, Testbefehle, Release-Checklisten, Designregeln, Schreibbeispiele und repositoryspezifische Skripte werden als wiederverwendbarer Skill gespeichert
- Mit
$skill-creatorwird strukturiert festgelegt, wann er ausgelöst werden soll, welche Materialien und Befehle zu verwenden sind und welche Ausgabe benötigt wird - Skills im Home-Verzeichnis können in allen Repos verwendet werden, projektinterne Skills lassen sich gemeinsam mit dem Team committen und teilen
- Geeignet für: Teams, die Codex wiederkehrende Aufgaben merken lassen möchten, statt jedes Mal lange Prompts einzufügen
27. Dokumentation aktualisieren (Engineering / Code)
Schwierigkeitsgrad: Easy | Dauer: 30m
- Liest Codeänderungen, Tests, Release Notes sowie den Kontext aus PRs/Issues mit und aktualisiert README, Entwicklerdokumentation, Migration Notes und Runbooks
- Empfehlenswert ist, Codex zunächst in der vorhandenen Dokumentation nach relevanten Feature-Namen, Config-Keys, Befehlen und Beispielen suchen zu lassen und dann nur die minimal nötige Dokumentationsoberfläche zu ändern
- Bei öffentlicher Dokumentation sollte ausdrücklich eingeschränkt werden, dass keine internen Roadmaps, Kundendaten oder nicht öffentliche Kontexte einfließen
- Geeignet für: technische Redaktion/Engineering-Teams, die Dokumentation parallel zu Änderungen im Produktverhalten pflegen müssen
28. iOS-Apps bauen (iOS / Code)
Schwierigkeitsgrad: Advanced | Dauer: 1h
- Codex scaffoldet eine SwiftUI-iOS-App und richtet eine CLI-first-Build-/Run-Schleife auf Basis von
xcodebuildoder Tuist ein - In bestehenden Projekten kann es so arbeiten, dass es Scheme-, Simulator-, Screenshot- und UI-Automation-Informationen über XcodeBuildMCP prüft
- Mit iOS-bezogenen Skills wie SwiftUI expert, Liquid Glass oder SwiftUI performance lassen sich UI-Implementierung, Nutzung neuer APIs und Performance-Prüfung robuster umsetzen
- Geeignet für: Greenfield-SwiftUI-Apps, bestehende iPhone-/iPad-Projekte, die simulatorbasierte Validierung benötigen
29. Eine Codebase refaktorieren (Engineering / Code)
Schwierigkeitsgrad: Advanced | Dauer: 1h
- Spürt toten Code, doppelte Logik, übergroße Module, veraltete Abstraktionen und Legacy-Patterns auf und bereinigt sie in kleinen, reviewbaren Einheiten
- Refactoring ist keine Stack-Migration, sondern eine Arbeit zur Verbesserung der Systemstruktur bei gleichbleibendem Verhalten; deshalb sollte ausdrücklich vorgegeben werden, das öffentliche Verhalten beizubehalten
- Für größere Aufräumarbeiten wird empfohlen, mit ExecPlan oder einem reusable Skill in Checkpoints zu unterteilen und Tests sowie Verifikation zu wiederholen
- Geeignet für: ältere Codebasen, bei denen neue Features zunehmend teuer werden, sowie Teams, die verhaltenswahrende Bereinigungen brauchen
30. iOS App Intents hinzufügen (iOS / Code)
Schwierigkeitsgrad: Advanced | Dauer: 1h
- Identifiziert die zentralen Aktionen und Entitäten in einer App, damit sie über Systemoberflächen wie Shortcuts, Siri, Spotlight, Widgets und Controls genutzt werden können
- Entwirft nicht zuerst den gesamten Bildschirm, sondern zunächst einige Aktionen, die Nutzer auch ohne Öffnen der App ausführen möchten, sowie Objekte, die das System verstehen muss
- Der Ablauf sieht vor, dass Codex die Modelle, die Navigation und die Datenzugriffspfade einer bestehenden App analysiert und die erste Intent-Oberfläche in kleinem Umfang implementieren lässt
- Geeignet für: Apps, die bereits nützliche Funktionen haben, aber in der iOS-Systemautomatisierung und Suche kaum sichtbar sind
31. macOS-Apps bauen (macOS / Code)
Schwierigkeit: Advanced | Dauer: 1h
- Beim Erstellen einer SwiftUI-basierten macOS-App wird zunächst ein Szenenmodell wie
WindowGroup,Window,Settings,MenuBarExtraoderDocumentGroupausgewählt - Richtet mit
xcodebuildoderswift buildund dem projektlokalenscript/build_and_run.sheine Shell-first-Build-/Ausführungsschleife ein - Je größer die App wird, desto stärker behandelt es Fenster, Menüs, Sidebars, Settings, AppKit-Interop und Signing-Fragen aus der Perspektive von Desktop-Apps
- Geeignet für: neue Mac-Apps, die eine native Desktop-Struktur brauchen, sowie Verbesserungen bei UI, Build und Deployment bestehender Mac-Apps
32. Liquid Glass anwenden (iOS / Code)
Schwierigkeit: Advanced | Dauer: 1h
- Baut eine bestehende SwiftUI-App auf Basis von iOS 26 und Xcode 26 und unterscheidet zwischen System-Glass, das Standard-Controls automatisch erhalten, und Custom-UI, die direkt ersetzt werden muss
- Führt dazu, einen Custom-Blur-/Material-Stack auf natives
glassEffect,GlassEffectContainer, den Glass-Button-Stil undglassEffectID-Transitionen umzustellen - Wenn Unterstützung für frühere iOS-Versionen nötig ist, müssen
#available(iOS 26, *)und ein Fallback-Pfad klar erhalten bleiben - Geeignet für: Teams, die High-Traffic-Flows bestehender Apps sicher auf iOS 26 Liquid Glass migrieren wollen
33. Mac-Telemetrie hinzufügen (macOS / Code)
Schwierigkeit: Advanced | Dauer: 30m
- Fügt auf Apple-
Loggerbasierende, signalstarke Logs für Abläufe wie Fensteröffnungen, Sidebar-Auswahl, Menübefehle und Sync-Meilensteine in Mac-Apps hinzu - Codex lässt die App bauen/ausführen und im Console oder per Log-Stream belegen, ob tatsächliche Ereignisse in der erwarteten Reihenfolge auftreten
- Vermeidet sensible Payloads, definiert Subsystem und Kategorie klar und ermöglicht so, im agentischen Debugging-Loop den nächsten Patch fundiert zu entscheiden
- Geeignet für: Mac-App-Funktionen, deren Abläufe sich allein per Code-Review schwer nachverfolgen lassen, sowie logbasierte Debugging-Loops
34. Im iOS-Simulator debuggen (iOS / Code)
Schwierigkeit: Advanced | Dauer: 1h
- Codex und XcodeBuildMCP finden Scheme/Simulator, bauen und starten die App, lesen dann die UI-Hierarchie aus und führen Tap-, Type-, Swipe-, Screenshot- und Log-Capture-Schritte aus
- Falls nötig, wird LLDB angehängt, um Stack-Frames, lokale Variablen und Breakpoints zu prüfen und einen vagen Bug-Report in eine reproduzierbare kleine Änderung zu überführen
- Nach Änderungen wird derselbe Simulator-Pfad erneut ausgeführt, um Belege dafür zu hinterlassen, dass der Bug verschwunden ist
- Geeignet für: iOS-UI-Bugs, die nur in bestimmten Tab-/Scroll-/Eingabeflows auftreten, sowie Crash-/Hang-/Navigationsprobleme
35. Abhängigkeitssicherheitsvorfälle auditieren (Engineering / Quality)
Schwierigkeit: Advanced | Dauer: 1h
- Wenn ein öffentliches Paket-Advisory oder ein Supply-Chain-Vorfall auftritt, wird nicht sofort gepatcht, sondern zunächst ein konservativer Read-only-Audit-Plan erstellt
- Codex unterscheidet zwischen maßgeblichen Quellen und allgemeinem Kommentar, definiert Evidence, mit der sich Exposure belegen oder ausschließen lässt, und prüft anschließend Manifest, Lockfile, CI-Workflow und Skripte
- Die Ausführung, Installation, der Build oder Test von untrusted Code wird standardmäßig bis zu einer ausdrücklichen Freigabe vermieden
- Geeignet für: Security-/Engineering-Teams und Maintainer, die schnell auf Dependency-Incidents reagieren müssen
36. Meeting-Briefs vorbereiten (Integrations / Knowledge Work)
Schwierigkeit: Easy | Dauer: 30m
- Sammelt den für ein Calendar Invite allein fehlenden Meeting-Kontext aus Drive-Dokumenten, Slack-Threads, Gmail und früheren Notizen und ordnet ihn in Objective, Agenda, Open Questions und eine Notes-Vorlage ein
- Codex lässt zunächst ein Sources-Inventar erstellen und trennt dann bestätigten Kontext, Source-Gaps und offene Fragen
- Meeting-Unterlagen sollen kurz und gut scannbar sein, und es muss nachvollziehbar bleiben, aus welcher Quelle welcher Inhalt stammt
- Geeignet für: Manager, PMs, Operatoren, Interviewer und alle, die vor Meetings schnell Kontext aufbereiten müssen
37. Event-Playbooks ausführen (Integrations / Knowledge Work)
Schwierigkeit: Intermediate | Dauer: 1h
- Führt Event-Planungskanäle, freigegebene Dokumente/Decks/Sheets/Vorlagen und Kalenderfristen zusammen, um ein quellengestütztes Playbook zu erstellen
- Entscheidend ist, öffentliches Event-Page-Copy und interne operative Checklisten, Zuständigkeiten, Freigaben und offene Fragen getrennt zu verwalten
- Bei wiederkehrenden Events kann dieselbe Thread-Automatisierung genutzt werden, um Fristen, Freigaben, fehlende Materialien und den Status der Launch-Checkliste nachzuverfolgen
- Geeignet für: Community-, DevRel-, Marketing- und Operations-Teams beim Management von Event-Programmen
38. Code-Migrationen durchführen (Engineering / Code)
Schwierigkeit: Advanced | Dauer: 1h
- Beim Wechsel von einem Legacy-Stack zu einem Ziel-Stack werden zunächst Routing, Datenmodell, Auth, Konfiguration, Background Jobs, Build, Deployment, Tests und externe Verträge inventarisiert
- Wählt eine inkrementelle Strategie wie Compatibility Layer, Module-by-Module-Port, Branch-by-Abstraction oder Strangler-Style-Replacement
- An jedem Checkpoint wird eine Paritätsvalidierung durchgeführt; sichtbare Änderungen, die die Migration selbst erfordert, werden explizit als Ausnahmen behandelt
- Geeignet für: Teams, die Framework-, Runtime-, Sprach- oder Build-System-Umstellungen in kontrollierten Einheiten durchführen müssen
39. SwiftUI-Bildschirme refaktorieren (iOS / Code)
Schwierigkeit: Advanced | Dauer: 1h
- Eine sehr große SwiftUI-Screen-Datei wird in kleinere Section-Views und einen expliziten Datenfluss aufgeteilt, ohne Verhalten und Layout zu verändern
- Der SwiftUI-View-Refactor-Skill des Plugins Build iOS Apps empfiehlt einen MV-first-Ansatz, vermeidet das unnötige Hinzufügen von View Models und verlagert Side Effects aus
bodyheraus - Wichtig ist, eine kleine Validierungsschleife anzuhängen, um zu prüfen, dass sich die UI nicht verändert hat und die Funktionen weiterhin wie zuvor arbeiten
- Geeignet für: SwiftUI-Screens, in deren
bodyLayout, Verzweigungen, Async-Arbeit und Inline-Actions vermischt sind
40. PRD-Entwürfe aus internem Kontext erstellen (Integrations / Knowledge Work)
Schwierigkeitsgrad: Easy | Zeitaufwand: 30 Min.
- Sammelt Linear-Projekte, Slack-Planungskanäle, Dokumente in Notion/Google Drive, Meeting-Notizen und Recherchematerial und erstellt daraus ein reviewbares PRD
- Sinnvoll ist es, einen klaren Abschnittsrahmen für Problem, Nutzer, Anforderungen, UX, technische Überlegungen, Launch-Plan, Timeline, Entscheidungen und offene Fragen vorzugeben
- Zuerst sollte der Source-Appendix geprüft werden, um zu sehen, welchen Kontext Codex verwendet hat; danach werden Anforderungen und offene Fragen verfeinert
- Geeignet für: PMs/Produktteams, die Informationen aus internen Teamdiskussionen in PRDs, Proposals, Launch-Briefs oder Decision Memos umwandeln
41. Cashflow prognostizieren (Data / Knowledge Work)
Schwierigkeitsgrad: Intermediate | Zeitaufwand: 30 Min.
- Erstellt durch Eingabe von beginning cash, expected receipts, payroll, vendor payments, debt, tax, capex, working capital und Timing-Annahmen ein bearbeitbares Cashflow-Forecast-Workbook
- Bewahrt die ursprüngliche Cadence und lässt einen Summary-Tab erstellen, der Annahmen zeigt, die zu einem Unterschreiten des Sicherheitsbestands oder zu Liquiditätsdruck führen
- Die erzeugte
.xlsxwird in Codex geöffnet, damit Formeln, Szenarien und Timing-Annahmen geprüft und im selben Thread angepasst werden können - Geeignet für: Finance-/Operations-Teams, die einen 13-Wochen- oder monatlichen Cash-Forecast erstellen
42. Ein DCF-Bewertungsmodell erstellen (Data / Knowledge Work)
Schwierigkeitsgrad: Intermediate | Zeitaufwand: 30 Min.
- Erstellt durch Eingabe von historical financials, valuation assumptions und modeling notes ein DCF-Workbook mit revenue growth, margin, capex, working capital, WACC und terminal value
- Codex erstellt eine bearbeitbare
.xlsxmit Modell-Tabellen, Formeln, Annahmen und einer Bewertungszusammenfassung, die Nutzer direkt in Codex prüfen und anpassen können - Im selben Thread können anschließend Formelverknüpfungen geprüft, Annahmen geändert, Szenarien ergänzt und das Modell weiter gestrafft werden
- Geeignet für: Analysten-/Finance-Teams, die schnell ein Bewertungs-Workbook erstellen und prüfen müssen
43. Abgleich von Budget und Ist-Zahlen prüfen (Data / Knowledge Work)
Schwierigkeitsgrad: Easy | Zeitaufwand: 30 Min.
- Erstellt durch Eingabe von budget plan, actuals export und close notes ein Review-Workbook, das Ist-Zahlen auf Plan-Kategorien abbildet und Abweichungen berechnet
- Bewahrt die ursprünglichen Inputs, Zuordnungen, Abweichungsformeln und den Summary-Tab und trennt Reconciliation-Probleme von offenen Finanzfragen
- Anpassungen an der Kategoriezuordnung, zusätzliche Department-Schnitte und das Verfassen eines Entwurfs für die Finanzzusammenfassung können im selben Thread fortgesetzt werden
- Geeignet für: Finance-Teams, die bei Monatsabschluss-Reviews Abweichungen zwischen Budget und Ausgaben gegenüber dem Management erklären müssen
44. Zielen folgen (Engineering / Automation)
Schwierigkeitsgrad: Advanced | Zeitaufwand: Long-running
- Mit
/goalarbeitet Codex über einen einzelnen Turn hinaus weiter, bis überprüfbare Abschlussbedingungen erreicht sind - Objective, Stopping Condition, zuerst zu lesende Dateien/Dokumente/Logs/Pläne sowie Commands oder Artefakte, die Fortschritt belegen, sollten klar angegeben werden
- Geeignet für Arbeiten wie Migrationen, große Refactors, Deployment-Retry-Loops, Experimente, Spiele oder Prototypen, die Codex checkpointweise eigenständig vorantreiben kann
- Geeignet für: Coding-Aufgaben, die über mehrere Stunden weiterlaufen müssen, bei denen Ziel und Validierungsschleife aber klar definiert sind
45. Evals zu einer AI-Anwendung hinzufügen (Evaluation / Quality)
Schwierigkeitsgrad: Intermediate | Zeitaufwand: 1 Std.
- Analysiert Prompt, Model-Call, Tool, Retrieval, Agent und Produktanforderungen einer bestehenden AI-App und fügt eine Promptfoo-Eval-Suite hinzu
- Statt das gesamte System auf einmal bewerten zu wollen, sollte mit einem einzelnen für Nutzer sichtbaren Verhalten wie classification, extraction, summarization, routing, grounding, tool use oder format rule begonnen werden
- Codex erstellt Konfiguration und Testdaten, führt Evals lokal aus und hinterlässt Commands, die auch später weiterverwendet werden können
- Geeignet für: AI-App-Teams, die vor Änderungen an Modell/Prompt/Retrieval/Agent Regressionstests einführen wollen
46. User Stories in UI-Mocks umwandeln (Integrations / Knowledge Work)
Schwierigkeitsgrad: Easy | Zeitaufwand: 30 Min.
- Sammelt Feedback aus Slack, Linear, Google Drive, Notizen aus Kundengesprächen usw., strukturiert es zu User Stories und Constraints und erzeugt dann mit ImageGen eine Richtung für UI-Mocks
- Wenn klare User Stories vorliegen, kann direkt begonnen werden; andernfalls sammelt Codex zunächst Kontext und normalisiert Problem und Anforderungen
- Ausgewählte Mocks werden in einem neuen Turn erneut angehängt und als funktionierender Prototyp umgesetzt, der Designsystem und Komponenten der bestehenden Codebasis wiederverwendet
- Geeignet für: Produkt-, Design- und Engineering-Teams, die verstreutes Produktfeedback in eine visuelle Richtung überführen und überprüfbare Mocks für das Team brauchen
47. Eine App in ChatGPT bringen (Integrations / Code)
Schwierigkeitsgrad: Advanced | Zeitaufwand: 1 Std.
- Eine ChatGPT-App rund um ein einziges, klar umrissenes User-Outcome entwerfen und MCP server, optionale Web-Komponente und Tool-Metadaten end-to-end erstellen
- Codex eignet sich gut dafür, die Gestaltung der Tool-Oberfläche und Metadaten, das Scaffold für den MCP server, die Widget-Implementierung, die Anbindung an ChatGPT und Golden-Prompt-Tests zu übernehmen
- Bereits in v1 zuerst festlegen, ob ein Widget wirklich nötig ist, ob Authentifizierung und Deployment erforderlich sind und ob sich lokales HTTPS-Testing sowie die Prüfung im Developer Mode durchführen lassen
- Geeignet für: Teams, die ihre erste ChatGPT-App bauen oder mit MCP server/Tool-Metadaten starten möchten, ohne sie unnötig aufzublähen
48. React-Native-App mit Expo erstellen (Mobile / Engineering)
Schwierigkeitsgrad: Mittel | Dauer: 1h
- Mit dem Expo-Plugin eine React-Native-App scaffolden und dabei Expo Router, die Expo-native Package-Konvention und schnelle Test-Loops auf Basis von Expo Go nutzen
- Nur dann zu Dev Client oder EAS Build wechseln, wenn Custom Native Code, Store-Distribution oder von Expo Go nicht unterstützte Capabilities benötigt werden
- Codex ermöglicht es, einen vollständigen Workflow mit Navigation im Native-Stil sowie Loading-, Empty- und Error-States zu erstellen und auf dem schnellsten Weg zu validieren
- Geeignet für: Entwickler, die eine Mobile-App mit Expo schnell prototypisieren oder für den Release vorbereiten möchten, bevor sie in nativen IDEs arbeiten
49. Eine CLI erstellen, die Codex verwenden kann (Engineering / Code)
Schwierigkeitsgrad: Mittel | Dauer: 1h
- APIs, Log-Quellen, Export-Inboxen, lokale DBs und Team-Skripte, auf die Codex wiederholt zugreifen muss, in eine zusammensetzbare CLI kapseln, damit sie in jedem Repo ausgeführt werden kann
- Eine gute CLI bietet agentenfreundliche Verhaltensweisen wie paged search, exaktes Lesen per ID, vorhersehbares JSON, Download, lokalen Index und draft-before-write
- Mit
$cli-creatordie CLI erstellen und mit$skill-creatoreine begleitende Skill anlegen, die dokumentiert, wann diese CLI verwendet werden soll - Geeignet für: Teams, bei denen Codex dieselben Services oder Datenquellen häufig lesen, durchsuchen und sicher bearbeiten muss
50. Slack-Action-Items priorisieren (Automation / Integrations)
Schwierigkeitsgrad: Einfach | Dauer: 30m
- Slack-DMs, Gruppen-DMs, Channel-Mentions und Thread-Replys lesen, um direkte Anfragen, implizite Follow-ups, bereits gelöste Punkte und noch offene Actions zu unterscheiden
- Codex liest bis zum aktuellen Ende eines Threads, bewertet, ob etwas unresolved ist, und erstellt anschließend anhand von Dringlichkeit und Auswirkung eine gerankte Action-Queue
- Entwürfe für Antworten oder Handoffs können erstellt werden, tatsächliches Posten/Senden sollte aber idealerweise auf Prüfung vor der Ausführung beschränkt bleiben
- Geeignet für: Workstreams in Launch, Support, Product, Operations und Community, in denen Arbeit über Slack eingeht
51. Verifizierbare Betriebs-Workflows ausführen (Automation / Integrations)
Schwierigkeitsgrad: Mittel | Dauer: 30m
- Codex wiederkehrende Betriebsaufgaben wie Access-Updates, Invite-Batches, Quota-Änderungen, Customer-Setup, Routing-Checks und Migration-Follow-ups ausführen lassen
- Input-Tabelle, Approval-Quelle, Policy, auszuführendes Script/API/CLI/Skill, Dry-Run-Status und Retry-Grenzen klar vorgeben und fehlende Felder nicht schätzen lassen
- Verifizierungsartefakte verlangen, die Menschen prüfen können, etwa Ergebnis-CSV, Log-Datei, Dashboard-Link, Screenshot oder PR-Check
- Geeignet für: Operative Aufgaben mit strukturierten Eingaben und klaren Freigabe- oder Audit-Spuren
52. Meetings in Folgeaufgaben umwandeln (Automation / Integrations)
Schwierigkeitsgrad: Mittel | Dauer: 5m
- Zoom-Transkripte und AI Companion Summary nutzen, um zentrale Erkenntnisse, Risiken, Chancen, Entscheidungen und Action-Items aus Kundengesprächen zu strukturieren
- Codex erstellt Entwürfe für Follow-up-E-Mails, Account-Pläne, CRM-Updates und Slack-Benachrichtigungen, während Versand oder Eintrag erst nach Prüfung durch den Nutzer erfolgen
- Die Wirkung steigt, wenn Zoom Cloud Recording, Transkript und AI Companion Summary zusammen mit Ziel-Tools wie Gmail, Slack, Google Docs und CRM verbunden werden
- Geeignet für: kundennahe Teams, die nach Discovery-, Renewal-, Implementation- oder Executive-Sponsor-Calls wiederkehrende Folgeaufgaben bearbeiten müssen
Noch keine Kommentare.