8 Punkte von GN⁺ 4 시간 전 | Noch keine Kommentare. | Auf WhatsApp teilen
  • OpenAI hat die Seite mit den Anwendungsfällen von Codex umfassend überarbeitet und von bisher 12 auf 52 Use Cases erweitert.
  • Die Positionierung verschiebt sich damit von einer reinen Programmierhilfe hin zu einer Plattform, an die unternehmensweite Teams Aufgaben delegieren können – darunter Engineering, Design, Daten, Finanzen, Operations, QA und Sales.
  • Von Computer Use (Mac-Automatisierung), Gmail-Posteingangsverwaltung, Slack, Zoom, Dokumenten und Spreadsheets über Finanzmodellierung (DCF, Cashflow, Budget), native iOS/macOS-Entwicklung, Sales- und Marketing-Workflows, QA, Automatisierung, Deployment, Evals bis zur ChatGPT-App: Die Beispiele sind als reale Arbeitsabläufe aufbereitet, die an Codex übergeben werden.

1. Codex als Arbeitskollegen einrichten (Automation / Integrations)

Schwierigkeitsgrad: Easy | Dauer: Long-running

  • Tools, in denen die Arbeit tatsächlich stattfindet – etwa Slack, Gmail, Calendar, Notion, GitHub, Linear oder lokale Notizen – werden in einem Codex-Thread verbunden, sodass es wie ein „Kollege mit Kenntnis meines Arbeitskontexts“ genutzt werden kann.
  • Beim ersten Durchlauf lässt man Codex wichtige, leicht übersehene Anfragen, geänderte Dokumente, untergegangene Entscheidungen und blockierte Handoffs aufspüren; der Nutzer gibt dann Feedback dazu, was nützlich ist und was nur Rauschen erzeugt.
  • Anschließend kann auf denselben Thread Automatisierung gelegt werden, damit der Kontext regelmäßig geprüft wird. Entscheidungen, die Urteilsvermögen erfordern, soll Codex nicht eigenmächtig treffen, sondern dem Nutzer vorlegen.
  • Geeignet für: Einzelpersonen, Operators, Manager, PMs und Engineers, die über viele Tools verteilten Arbeitskontext laufend nachverfolgen müssen.

2. Feedback in Aktionen umsetzen (Data / Integrations)

Schwierigkeitsgrad: Easy | Dauer: 30m

  • Feedback aus verschiedenen Quellen – etwa Slack-Kanälen, GitHub-/Linear-Issues, Umfrage-CSV-Dateien, Notizen aus Kundeninterviews oder Google-Drive-Dokumenten – wird gesammelt und in ein prüfbares Ergebnis in Form eines Google Sheets oder Google Docs überführt.
  • Codex bündelt Feedback nach Themen, Beleg-Links, Folgefragen und zugewiesenen Aktionen; geprüfte Inhalte können anschließend in Slack-Updates oder Issue-Entwürfe überführt werden.
  • Wenn sich die Feedback-Quellen laufend ändern, kann im selben Thread Automatisierung eingerichtet werden, sodass nur neue Themen oder Punkte mit stärkerer Beleglage gemeldet werden.
  • Geeignet für: Teams, die Beta-Feedback, Customer VOC, Issue-Threads oder Research-Notizen in Produktmaßnahmen überführen müssen.

3. Unordentliche Daten bereinigen und vorbereiten (Data / Knowledge Work)

Schwierigkeitsgrad: Easy | Dauer: 5m

  • Wenn in CSV-Dateien oder Spreadsheets gemischte Datumsformate, Währungsstrings, doppelte Zeilen, leere Werte, Summenzeilen oder Aliase enthalten sind, lässt sich unter Beibehaltung des Originals eine bereinigte Kopie erzeugen.
  • Der Nutzer gibt klar an, welche Probleme bereits sichtbar sind und welches Zielformat gewünscht ist, zum Beispiel eine bereinigte CSV, eine Datei zum Hochladen oder ein neuer Sheet-Tab.
  • Codex hinterlässt zusammen mit der bereinigten Datei auch Hinweise zur Datenqualität, damit diese vor einer Analyse oder einem Upload noch von Menschen geprüft werden können.
  • Geeignet für: Teams, die aus verschiedenen Systemen erhaltene Datendateien für Analysen oder die Eingabe in operative Systeme aufbereiten müssen.

4. Tabellarische Daten abfragen (Data / Knowledge Work)

Schwierigkeitsgrad: Easy | Dauer: 30m

  • Stellt man Fragen zu CSV-Dateien, Spreadsheets, Dashboard-Exports, Google Sheets oder lokalen Datendateien, prüft Codex die Spalten und führt Berechnungen, Aggregationen sowie die Erstellung von Diagrammen aus.
  • Empfohlen wird ein Ablauf, der nicht bei einer einfachen Antwort endet, sondern HTML-basierte Browser-Visualisierungen erzeugt, die sich direkt in der Codex-App öffnen lassen.
  • Nach einer ersten Analyse können im selben Thread Folgeanalysen zu Regionen, Kohorten, Produkten, Kalenderwochen, Modellversionen oder Kundensegmenten angestoßen werden.
  • Geeignet für: datengetriebene Arbeit, bei der schnelle Berechnungen, einfache Diagramme oder Zusammenfassungen für Meetings benötigt werden.

5. GitHub Pull Requests reviewen (Integrations / Workflow)

Schwierigkeitsgrad: Easy | Dauer: 5s

  • Codex Code Review kann mit einer GitHub-Organisation oder einem Repository verbunden werden, um für jeden PR automatische Reviews zu erhalten oder per PR-Kommentar manuell ein Review anzufordern.
  • Der Fokus liegt darauf, zusätzliche Prüfsignale für Punkte zu erhalten, die Menschen leicht übersehen – etwa Sicherheitsregressionen, fehlende Tests, riskante Verhaltensänderungen oder fehlende Dokumentation.
  • Wenn in AGENTS.md Review-Prioritäten und dateispezifische Regeln hinterlegt werden, lassen sich die Review-Kriterien von Codex an das jeweilige Repository anpassen.
  • Geeignet für: Teams, die vor dem Merge zusätzliche Prüfsignale brauchen, sowie für große Codebases im laufenden Betrieb.

6. Den Posteingang verwalten (Automation / Integrations)

Schwierigkeitsgrad: Easy | Dauer: 5m

  • Durch die Verbindung mit Gmail lassen sich E-Mails finden, die eine Antwort benötigen; auf Basis kürzlich gesendeter Mails oder freigegebener Schreibbeispiele erstellt Codex Antwortentwürfe im Ton des Nutzers.
  • Reicht der Kontext aus den E-Mails allein nicht aus, kann Codex in Arbeitstools wie Slack, Google Drive oder Projektnotizen nach aktuellen Entscheidungen, Verantwortlichen, Dateien oder Blockern suchen.
  • Der erste Durchlauf sollte als Kalibrierung betrachtet werden: Man gibt Feedback dazu, welche Mails ignoriert werden sollen und welcher Ton passt, und entwickelt daraus anschließend eine regelmäßige Automatisierung.
  • Geeignet für: Menschen, die das Sortieren des Posteingangs und das Erstellen von Antwortentwürfen wiederholt bearbeiten möchten.

7. Responsives Frontend-Design umsetzen (Front-end / Design)

Schwierigkeitsgrad: Intermediate | Dauer: 1h

  • Screenshots, Design-Briefs und Referenzbilder werden als Input genutzt und in responsive UI umgesetzt, die Design-System, Tokens und Komponenten eines bestehenden Repositorys wiederverwendet.
  • Codex öffnet mit Playwright einen echten Browser und vergleicht die Umsetzung an Desktop- und Mobile-Breakpoints mit der Referenz, um sie iterativ zu verbessern.
  • Bei unklaren Punkten empfiehlt es sich, Codex anzuweisen, statt eines neuen Design-Systems die einfachste Umsetzung im Rahmen vorhandener Muster zu wählen und getroffene Annahmen explizit zu machen.
  • Geeignet für: die Umsetzung neuer Frontend-Screens und das Einfügen gestalteter Screens in bestehende Apps.

8. Eine große Codebase verstehen (Engineering / Analysis)

Schwierigkeitsgrad: Easy | Dauer: 5m

  • Beim Einstieg in ein unbekanntes Repository oder einen fremden Funktionsbereich kann man Codex den Request-Flow, Verantwortlichkeiten der Module, Orte der Datenvalidierung, Nebenwirkungen und als Nächstes zu lesende Dateien erklären lassen.
  • Praktischere Erklärungen erhält man meist, wenn statt einer pauschalen Gesamtzusammenfassung ein konkreter Systembereich angegeben wird.
  • Empfohlen wird ein Ablauf mit Folgefragen zu Orten der Business-Logik, Validierungsstellen, leicht zu übersehenden Hintergrundjobs und Tests, die nach Änderungen ausgeführt werden sollten.
  • Geeignet für: das Onboarding neuer Engineers und Entwickler, die vor einer Funktionsänderung den Codefluss schnell erfassen müssen.

9. Eine Mac-App-Shell erstellen (macOS / Code)

Schwierigkeitsgrad: Advanced | Dauer: 1h

  • Mit dem Plugin Build macOS Apps wird eine Mac-native SwiftUI-App-Shell erstellt und eine auf NavigationSplitView basierende Struktur aus Sidebar, Detail-Panel und Inspector aufgebaut.
  • Es wird empfohlen, Menüs, Toolbar, Tastenkürzel und eine Settings-Scene früh so zu entwerfen, dass sie sich für Desktop-Apps natürlich anfühlen.
  • Ziel ist keine bloß hochskalierte iPad- oder Web-App, sondern eine Mac-App-Struktur, in der Fenster, Auswahlzustand, Befehle und Einstellungen stabil funktionieren.
  • Geeignet für: Mac-Apps wie Editoren, Bibliotheken, Admin-Tools oder Review-Tools, die Sidebar und Inspector benötigen.

10. Mit Codex meinen Computer bedienen (Knowledge Work / Workflow)

Schwierigkeitsgrad: Easy | Dauer: 5m

  • Mit Computer Use kann Codex Mac-Apps direkt sehen, klicken und Eingaben machen und dabei Aufgaben über mehrere Apps und Fenster hinweg ausführen.
  • Das eignet sich gut für Abläufe in normalen App-UIs ohne dediziertes Plugin, etwa um Informationen aus Notes zu holen und in ein anderes System einzugeben oder Inhalte in Messages zu prüfen und Antworten zu verfassen.
  • Anfragen beginnen mit @Computer, und es ist sinnvoll, das gewünschte Ergebnis sowie riskante Aktionen, bei denen angehalten werden soll, mit anzugeben.
  • Geeignet für: wiederkehrende Aufgaben, die nur innerhalb von App-UIs möglich sind, sowie Wissensarbeit über mehrere Fenster und Dateien hinweg

11. Bug-Triage automatisieren (Automation / Quality)

Schwierigkeit: Intermediate | Dauer: 1h

  • Codex lässt sich durch Orte navigieren, an denen Bug-Signale zusammenlaufen, etwa Sentry-Benachrichtigungen, Slack-Threads, Linear-/GitHub-Issues, PR-Fehlerschranken, Logs und Support-Tickets.
  • Zunächst wird per manuellem Sweep eine Kandidatenliste erstellt, dann wird im selben Thread nachjustiert, welche Einträge nützlich sind, bevor auf regelmäßige Automatisierung umgestellt wird.
  • Wenn das System ausreichend vertrauenswürdig ist, kann Codex sogar Entwürfe für Linear-Issues, Slack-Updates, GitHub-Kommentare und Handoff-Notizen erstellen.
  • Geeignet für: Produkt- und Engineering-Teams, die täglich über mehrere Tools verteilte Bug-Reports priorisieren müssen

12. Slide-Decks erstellen (Data / Integrations)

Schwierigkeit: Easy | Dauer: 30m

  • Codex bearbeitet PowerPoint-Dateien direkt per Code und kombiniert dies mit Bilderzeugung, um bestehende Decks zu aktualisieren oder neue Decks zu erstellen.
  • Dabei werden Regeln vor der Auslieferung festgelegt, etwa Logo-Positionen, Text-/Bildanordnung auf bestimmten Folien, Beibehaltung bestehender Branding-Vorgaben sowie Prüfung auf Overflow und Font-Ersetzungen.
  • Es wird empfohlen, die Folien als editierbare .pptx zu belassen; wiederholbare Layout-Regeln kann Codex dabei pro Folie anwenden.
  • Geeignet für: Teams, die strukturierte Eingaben oder Notizen in Präsentationsmaterial umwandeln, sowie Arbeiten, bei denen bestehende Decks in größerem Umfang angepasst werden müssen

13. Coding-Aufgaben in Slack starten (Integrations / Workflow)

Schwierigkeit: Easy | Dauer: 5m

  • Nach der Installation der Slack-App und dem Verbinden von Repository und Umgebung kann per Erwähnung von @Codex im Thread eine Coding-Aufgabe gestartet werden.
  • Wenn der Thread genügend Informationen zu Anfrage, Einschränkungen und gewünschtem Ergebnis enthält, führt Codex auf Basis dieses Kontexts einen Cloud-Task aus.
  • Über den Ergebnislink lässt sich das Resultat prüfen, und zusätzliche Anpassungen können bei Bedarf im selben Slack-Thread fortgeführt werden.
  • Geeignet für: Teams, die direkt aus Slack-Diskussionen heraus Issue-Triage, Bugfixes oder kleine Implementierungsaufgaben übergeben möchten

14. Kleine UI-Änderungen schnell iterieren (Front-end / Design)

Schwierigkeit: Easy | Dauer: 5m

  • Wenn die Struktur einer bestehenden App bereits steht, lassen sich kleine UI-Änderungen wie Spacing, Alignment, Farbe, Copy, responsives Verhalten oder States schnell einzeln umsetzen.
  • Empfohlen wird eine Schleife wie bei Codex-Spark mit einem schnellen Modell: „eine visuelle Notiz auf einmal, eine kleine Änderung auf einmal, eine Browser-Prüfung auf einmal“.
  • Dabei soll der Änderungsumfang präzise festgelegt und verlangt werden, dass bestehende Komponenten, Tokens, Layout-Primitives und Datenflüsse erhalten bleiben.
  • Geeignet für: feingranulare UI-Korrekturen aus Design-Reviews sowie Änderungen, die direkt in einer Produkt-Review-Runde umgesetzt werden sollen

15. Onboarding neuer Mitarbeitender koordinieren (Integrations / Data)

Schwierigkeit: Intermediate | Dauer: 30m

  • Aus genehmigten Listen neuer Mitarbeitender, Onboarding-Trackern, Manager-/Team-Mappings, dem Status von Hardware- und Account-Vorbereitung sowie Kalender-Meilensteinen wird ein prüfbares Onboarding-Paket erstellt.
  • Empfohlen wird, den ersten Durchlauf schreibgeschützt zu halten und echte Einladungen, DMs, E-Mails, Channel-Erstellungen und System-Updates erst nach Prüfung explizit zu genehmigen.
  • Dabei können auch Team-Zusammenfassungen, Lücken im Vorbereitungsstand, Namen für Willkommensräume, Einladungslisten, Checklisten für die erste Woche und Ankündigungsentwürfe vorbereitet werden.
  • Geeignet für: People, Recruiting, IT, Workplace Operations und Manager, die neue Mitarbeitende aufnehmen

16. Ein neues Konzept lernen (Knowledge Work / Data)

Schwierigkeit: Intermediate | Dauer: 30m

  • Codex kann dichte Materialien wie Papers, Vorlesungsunterlagen oder lange Dokumente lesen und Problemstellung, Beitrag, Methode, Experimente, Grenzen und Vorwissen strukturieren.
  • Mit Subagents lassen sich Rollen wie das Erfassen der Dokumentstruktur, Recherche zu Vorwissen, Analyse von Abbildungen/Formeln und das Schreiben des Abschlussberichts aufteilen.
  • Als Ergebnis eignen sich Formen, die später erneut geprüft werden können, etwa Markdown-Berichte, Mermaid-Diagramme, Concept Maps oder Claim-to-Evidence-Tabellen.
  • Geeignet für: Menschen, die sich schnell in ein unbekanntes Forschungsfeld, komplexe technische Konzepte oder lange Kursmaterialien einarbeiten müssen

17. API-Integrationen upgraden (Evaluation / Engineering)

Schwierigkeit: Intermediate | Dauer: 1h

  • Bestehende OpenAI-API-Integrationen werden auf die neuesten empfohlenen Modelle und API-Funktionen umgestellt, wobei Verhaltensgleichheit und Regressionsprüfung gemeinsam sichergestellt werden.
  • Es geht nicht nur darum, Modellnamen auszutauschen; stattdessen werden zuerst aktuelle Endpoints, Tool-Annahmen, Antwortformate, Prompts und Evaluationspfade inventarisiert.
  • Empfohlen wird ein Ablauf, bei dem mit openai-docs die neuesten Modell-/Prompt-Guides geprüft und Änderungen vor und nach der Umstellung mit einer Eval-Pipeline wie Promptfoo verifiziert werden.
  • Geeignet für: Produkte mit älteren Modellen/Endpoints sowie Teams, die beim Modell-Upgrade Regressionstests benötigen

18. Eine App oder Website deployen (Front-end / Integrations)

Schwierigkeit: Intermediate | Dauer: 30m

  • Auf Basis von Repository, Screenshots, Design-Briefing, Produktidee, API-Dokumentation und Datenquellen kann Codex eine Web-App erstellen oder anpassen und bis zu einer Vercel-Preview-URL deployen.
  • Entscheidend ist, vor dem Deployment Projektprüfung, Build/Tests, Analyse von Fehler-Logs und Validierung der Preview ausführen zu lassen.
  • Auch nach dem Deployment können im selben Thread Anpassungen wie Mobile-Layout-Korrekturen, Einbindung aktueller Daten oder Fixes für fehlgeschlagene Build-Logs fortgeführt werden.
  • Geeignet für: Teams, die Ideen oder Designs schnell als teilbare Web-Preview umsetzen möchten

19. Figma-Designs in Code umsetzen (Front-end / Design)

Schwierigkeit: Intermediate | Dauer: 1h

  • Über den Figma-MCP-Server werden Designkontext, Variablen, Assets und Varianten exakter Knoten geholt und anschließend passend zum Designsystem des bestehenden Repositorys in Code übersetzt.
  • Empfohlen wird ein Vorgehen mit get_design_context und bei Bedarf anschließend get_metadata und get_screenshot, um Struktur und Referenzen zu sichern und dann mit der Implementierung zu beginnen.
  • Mit Playwright wird das Umsetzungsergebnis im Browser mit der Figma-Referenz verglichen, während Unterschiede bei responsivem Verhalten und Interaktionen iterativ korrigiert werden.
  • Geeignet für: Design- und Frontend-Teams, die in Figma fertig ausgearbeitete Screens oder Flows in eine bestehende Codebase implementieren müssen

20. App-QA mit Computer Use durchführen (Automation / Quality)

Schwierigkeit: Intermediate | Dauer: 30m

  • Computer Use sieht die tatsächliche Benutzeroberfläche, klickt, gibt Eingaben ein, scrollt, führt zentrale User Flows aus und protokolliert Stellen, an denen Fehler auftreten
  • Dabei sollten Umgebung, die zu testenden Kern-Flows, das Format des Bug-Reports, Schweregrad-Kriterien, Reproduktionsschritte sowie erwartete/tatsächliche Ergebnisse klar vorgegeben werden
  • Es kann sowohl Funktionsfehler als auch UI-Probleme erfassen; die Ergebnisse werden in Form einer Triage Summary aufbereitet, die sich an QA-Reports oder an Engineer übergeben lässt
  • Geeignet für: Validierung zentraler Flows vor dem Release, Teams, die manuelle QA strukturieren möchten

21. Datensätze analysieren und Reports erstellen (Data / Analysis)

Schwierigkeitsgrad: Intermediate | Dauer: 1h

  • Lädt unaufgeräumte Datendateien, bereinigt sie, führt Joins, explorative Analysen, Visualisierungen und Modellierung durch und verpackt das Ergebnis als Berichte oder Dashboards für Entscheidungen
  • Wichtig ist, Codex zunächst die Python-Umgebung des Projekts, den Package Manager, den Ausgabeordner und die Skriptkonventionen verstehen zu lassen
  • Wiederkehrende Notebook-Bereinigung, Spreadsheet-Export und das Packaging des finalen Reports lassen sich als reusable Skill auslagern, damit derselbe Analyse-Workflow leicht wiederverwendet werden kann
  • Geeignet für: Analysten/Produktteams, die reproduzierbare Analyseartefakte von der Datenbereinigung über Charts und Memos bis zum Bericht benötigen

22. Aufgaben aus Nachrichten erledigen (Knowledge Work / Integrations)

Schwierigkeitsgrad: Easy | Dauer: 5m

  • Computer Use findet und erledigt verborgene To-dos in Messages-Threads, etwa Buchungen, Recherchen, Terminabstimmungen, Belegeinreichungen oder das Zusammentragen von Informationen
  • Bestimmte Absender oder Threads können vorgegeben werden, und nach Abschluss der Aufgabe kann ein Entwurf für eine Antwort im ursprünglichen Nachrichten-Thread erstellt werden
  • Bei schwer rückgängig zu machenden Aktionen wie Zahlungen, Bestellungen oder Buchungsbestätigungen ist es wichtig anzuweisen, unbedingt anzuhalten und eine Freigabe einzuholen
  • Geeignet für: Personen, die kleine umsetzbare Aufgaben aus persönlichen Nachrichten nicht übersehen und zuverlässig erledigen möchten

23. Aus einer Idee ein PoC machen (Front-end / Engineering)

Schwierigkeitsgrad: Intermediate | Dauer: 1h

  • Mit GPT Image/ImageGen wird zunächst ein hochwertiges UI-Mockup erstellt, um die visuelle Richtung festzulegen; auf Basis dieses Mockups wird dann mit Build Web Apps oder dem Game Studio Plugin ein funktionsfähiger Prototyp umgesetzt
  • Geeignet für frühe Produktideen, bei denen ein tatsächlich anklickbarer PoC mehr Antworten liefert als eine reine Dokumentationsplanung
  • Bilder, die schließlich umgesetzt werden sollen, hängt man am besten in einem neuen Turn an, damit Codex sie direkt als Referenz nutzen kann
  • Geeignet für: Teams, die Dashboards, Tools, Web-Apps oder Spielideen schnell visualisieren und validieren möchten

24. Browserbasierte Spiele erstellen (Engineering / Code)

Schwierigkeitsgrad: Intermediate | Dauer: Long-running

  • Statt direkt vom Game Brief ins Coding zu gehen, lässt man zuerst eine PLAN.md erstellen, die Spielerziel, Main Loop, Steuerung, Sieg-/Niederlagebedingungen, Rendering und Asset-Planung enthält
  • Mit ImageGen werden Concept Art, Sprites, Hintergründe und UI-Assets erzeugt; mit Playwright werden Spielgefühl und Bildschirminhalt im echten Browser getestet und iterativ verbessert
  • Spiele müssen fortlaufend bei Code, UI, Assets, Balancing und Deployment überprüft werden, weshalb dies gut zu den langfristigen iterativen Aufgaben von Codex passt
  • Geeignet für: Arbeiten, bei denen ein Browserspiel von Grund auf erstellt oder das Bediengefühl und die Visuals eines Prototyps iterativ validiert werden müssen

25. Schwierige Probleme iterativ verbessern (Engineering / Analysis)

Schwierigkeitsgrad: Advanced | Dauer: Long-running

  • Es werden ein klares Bewertungssystem, Score-Skripte und überprüfbare Artefakte bereitgestellt, damit Codex eine scorebasierte Verbesserungsschleife ausführen kann
  • Dabei werden deterministic checks und LLM-as-a-judge-Bewertungen gemeinsam verwendet, und es werden Stopping Rules für Overall Score und Judge Average festgelegt
  • Die Struktur sieht vor, dass Codex in jeder Iteration die aktuelle Ausgabe prüft, die Bewertung misst, genau eine Verbesserung anwendet, erneut evaluiert und Logs schreibt
  • Geeignet für: Optimierungsprobleme, die nicht in einem Durchgang gelöst sind, sowie Aufgaben, bei denen visuelle oder subjektive Qualität mehrfach verbessert werden muss

26. Workflows als Skill speichern (Engineering / Workflow)

Schwierigkeitsgrad: Easy | Dauer: 5m

  • Gut funktionierende Codex-Threads, Review-Regeln, Testbefehle, Release-Checklisten, Designregeln, Schreibbeispiele und repositoryspezifische Skripte werden als wiederverwendbarer Skill gespeichert
  • Mit $skill-creator wird strukturiert festgelegt, wann er ausgelöst werden soll, welche Materialien und Befehle zu verwenden sind und welche Ausgabe benötigt wird
  • Skills im Home-Verzeichnis können in allen Repos verwendet werden, projektinterne Skills lassen sich gemeinsam mit dem Team committen und teilen
  • Geeignet für: Teams, die Codex wiederkehrende Aufgaben merken lassen möchten, statt jedes Mal lange Prompts einzufügen

27. Dokumentation aktualisieren (Engineering / Code)

Schwierigkeitsgrad: Easy | Dauer: 30m

  • Liest Codeänderungen, Tests, Release Notes sowie den Kontext aus PRs/Issues mit und aktualisiert README, Entwicklerdokumentation, Migration Notes und Runbooks
  • Empfehlenswert ist, Codex zunächst in der vorhandenen Dokumentation nach relevanten Feature-Namen, Config-Keys, Befehlen und Beispielen suchen zu lassen und dann nur die minimal nötige Dokumentationsoberfläche zu ändern
  • Bei öffentlicher Dokumentation sollte ausdrücklich eingeschränkt werden, dass keine internen Roadmaps, Kundendaten oder nicht öffentliche Kontexte einfließen
  • Geeignet für: technische Redaktion/Engineering-Teams, die Dokumentation parallel zu Änderungen im Produktverhalten pflegen müssen

28. iOS-Apps bauen (iOS / Code)

Schwierigkeitsgrad: Advanced | Dauer: 1h

  • Codex scaffoldet eine SwiftUI-iOS-App und richtet eine CLI-first-Build-/Run-Schleife auf Basis von xcodebuild oder Tuist ein
  • In bestehenden Projekten kann es so arbeiten, dass es Scheme-, Simulator-, Screenshot- und UI-Automation-Informationen über XcodeBuildMCP prüft
  • Mit iOS-bezogenen Skills wie SwiftUI expert, Liquid Glass oder SwiftUI performance lassen sich UI-Implementierung, Nutzung neuer APIs und Performance-Prüfung robuster umsetzen
  • Geeignet für: Greenfield-SwiftUI-Apps, bestehende iPhone-/iPad-Projekte, die simulatorbasierte Validierung benötigen

29. Eine Codebase refaktorieren (Engineering / Code)

Schwierigkeitsgrad: Advanced | Dauer: 1h

  • Spürt toten Code, doppelte Logik, übergroße Module, veraltete Abstraktionen und Legacy-Patterns auf und bereinigt sie in kleinen, reviewbaren Einheiten
  • Refactoring ist keine Stack-Migration, sondern eine Arbeit zur Verbesserung der Systemstruktur bei gleichbleibendem Verhalten; deshalb sollte ausdrücklich vorgegeben werden, das öffentliche Verhalten beizubehalten
  • Für größere Aufräumarbeiten wird empfohlen, mit ExecPlan oder einem reusable Skill in Checkpoints zu unterteilen und Tests sowie Verifikation zu wiederholen
  • Geeignet für: ältere Codebasen, bei denen neue Features zunehmend teuer werden, sowie Teams, die verhaltenswahrende Bereinigungen brauchen

30. iOS App Intents hinzufügen (iOS / Code)

Schwierigkeitsgrad: Advanced | Dauer: 1h

  • Identifiziert die zentralen Aktionen und Entitäten in einer App, damit sie über Systemoberflächen wie Shortcuts, Siri, Spotlight, Widgets und Controls genutzt werden können
  • Entwirft nicht zuerst den gesamten Bildschirm, sondern zunächst einige Aktionen, die Nutzer auch ohne Öffnen der App ausführen möchten, sowie Objekte, die das System verstehen muss
  • Der Ablauf sieht vor, dass Codex die Modelle, die Navigation und die Datenzugriffspfade einer bestehenden App analysiert und die erste Intent-Oberfläche in kleinem Umfang implementieren lässt
  • Geeignet für: Apps, die bereits nützliche Funktionen haben, aber in der iOS-Systemautomatisierung und Suche kaum sichtbar sind

31. macOS-Apps bauen (macOS / Code)

Schwierigkeit: Advanced | Dauer: 1h

  • Beim Erstellen einer SwiftUI-basierten macOS-App wird zunächst ein Szenenmodell wie WindowGroup, Window, Settings, MenuBarExtra oder DocumentGroup ausgewählt
  • Richtet mit xcodebuild oder swift build und dem projektlokalen script/build_and_run.sh eine Shell-first-Build-/Ausführungsschleife ein
  • Je größer die App wird, desto stärker behandelt es Fenster, Menüs, Sidebars, Settings, AppKit-Interop und Signing-Fragen aus der Perspektive von Desktop-Apps
  • Geeignet für: neue Mac-Apps, die eine native Desktop-Struktur brauchen, sowie Verbesserungen bei UI, Build und Deployment bestehender Mac-Apps

32. Liquid Glass anwenden (iOS / Code)

Schwierigkeit: Advanced | Dauer: 1h

  • Baut eine bestehende SwiftUI-App auf Basis von iOS 26 und Xcode 26 und unterscheidet zwischen System-Glass, das Standard-Controls automatisch erhalten, und Custom-UI, die direkt ersetzt werden muss
  • Führt dazu, einen Custom-Blur-/Material-Stack auf natives glassEffect, GlassEffectContainer, den Glass-Button-Stil und glassEffectID-Transitionen umzustellen
  • Wenn Unterstützung für frühere iOS-Versionen nötig ist, müssen #available(iOS 26, *) und ein Fallback-Pfad klar erhalten bleiben
  • Geeignet für: Teams, die High-Traffic-Flows bestehender Apps sicher auf iOS 26 Liquid Glass migrieren wollen

33. Mac-Telemetrie hinzufügen (macOS / Code)

Schwierigkeit: Advanced | Dauer: 30m

  • Fügt auf Apple-Logger basierende, signalstarke Logs für Abläufe wie Fensteröffnungen, Sidebar-Auswahl, Menübefehle und Sync-Meilensteine in Mac-Apps hinzu
  • Codex lässt die App bauen/ausführen und im Console oder per Log-Stream belegen, ob tatsächliche Ereignisse in der erwarteten Reihenfolge auftreten
  • Vermeidet sensible Payloads, definiert Subsystem und Kategorie klar und ermöglicht so, im agentischen Debugging-Loop den nächsten Patch fundiert zu entscheiden
  • Geeignet für: Mac-App-Funktionen, deren Abläufe sich allein per Code-Review schwer nachverfolgen lassen, sowie logbasierte Debugging-Loops

34. Im iOS-Simulator debuggen (iOS / Code)

Schwierigkeit: Advanced | Dauer: 1h

  • Codex und XcodeBuildMCP finden Scheme/Simulator, bauen und starten die App, lesen dann die UI-Hierarchie aus und führen Tap-, Type-, Swipe-, Screenshot- und Log-Capture-Schritte aus
  • Falls nötig, wird LLDB angehängt, um Stack-Frames, lokale Variablen und Breakpoints zu prüfen und einen vagen Bug-Report in eine reproduzierbare kleine Änderung zu überführen
  • Nach Änderungen wird derselbe Simulator-Pfad erneut ausgeführt, um Belege dafür zu hinterlassen, dass der Bug verschwunden ist
  • Geeignet für: iOS-UI-Bugs, die nur in bestimmten Tab-/Scroll-/Eingabeflows auftreten, sowie Crash-/Hang-/Navigationsprobleme

35. Abhängigkeitssicherheitsvorfälle auditieren (Engineering / Quality)

Schwierigkeit: Advanced | Dauer: 1h

  • Wenn ein öffentliches Paket-Advisory oder ein Supply-Chain-Vorfall auftritt, wird nicht sofort gepatcht, sondern zunächst ein konservativer Read-only-Audit-Plan erstellt
  • Codex unterscheidet zwischen maßgeblichen Quellen und allgemeinem Kommentar, definiert Evidence, mit der sich Exposure belegen oder ausschließen lässt, und prüft anschließend Manifest, Lockfile, CI-Workflow und Skripte
  • Die Ausführung, Installation, der Build oder Test von untrusted Code wird standardmäßig bis zu einer ausdrücklichen Freigabe vermieden
  • Geeignet für: Security-/Engineering-Teams und Maintainer, die schnell auf Dependency-Incidents reagieren müssen

36. Meeting-Briefs vorbereiten (Integrations / Knowledge Work)

Schwierigkeit: Easy | Dauer: 30m

  • Sammelt den für ein Calendar Invite allein fehlenden Meeting-Kontext aus Drive-Dokumenten, Slack-Threads, Gmail und früheren Notizen und ordnet ihn in Objective, Agenda, Open Questions und eine Notes-Vorlage ein
  • Codex lässt zunächst ein Sources-Inventar erstellen und trennt dann bestätigten Kontext, Source-Gaps und offene Fragen
  • Meeting-Unterlagen sollen kurz und gut scannbar sein, und es muss nachvollziehbar bleiben, aus welcher Quelle welcher Inhalt stammt
  • Geeignet für: Manager, PMs, Operatoren, Interviewer und alle, die vor Meetings schnell Kontext aufbereiten müssen

37. Event-Playbooks ausführen (Integrations / Knowledge Work)

Schwierigkeit: Intermediate | Dauer: 1h

  • Führt Event-Planungskanäle, freigegebene Dokumente/Decks/Sheets/Vorlagen und Kalenderfristen zusammen, um ein quellengestütztes Playbook zu erstellen
  • Entscheidend ist, öffentliches Event-Page-Copy und interne operative Checklisten, Zuständigkeiten, Freigaben und offene Fragen getrennt zu verwalten
  • Bei wiederkehrenden Events kann dieselbe Thread-Automatisierung genutzt werden, um Fristen, Freigaben, fehlende Materialien und den Status der Launch-Checkliste nachzuverfolgen
  • Geeignet für: Community-, DevRel-, Marketing- und Operations-Teams beim Management von Event-Programmen

38. Code-Migrationen durchführen (Engineering / Code)

Schwierigkeit: Advanced | Dauer: 1h

  • Beim Wechsel von einem Legacy-Stack zu einem Ziel-Stack werden zunächst Routing, Datenmodell, Auth, Konfiguration, Background Jobs, Build, Deployment, Tests und externe Verträge inventarisiert
  • Wählt eine inkrementelle Strategie wie Compatibility Layer, Module-by-Module-Port, Branch-by-Abstraction oder Strangler-Style-Replacement
  • An jedem Checkpoint wird eine Paritätsvalidierung durchgeführt; sichtbare Änderungen, die die Migration selbst erfordert, werden explizit als Ausnahmen behandelt
  • Geeignet für: Teams, die Framework-, Runtime-, Sprach- oder Build-System-Umstellungen in kontrollierten Einheiten durchführen müssen

39. SwiftUI-Bildschirme refaktorieren (iOS / Code)

Schwierigkeit: Advanced | Dauer: 1h

  • Eine sehr große SwiftUI-Screen-Datei wird in kleinere Section-Views und einen expliziten Datenfluss aufgeteilt, ohne Verhalten und Layout zu verändern
  • Der SwiftUI-View-Refactor-Skill des Plugins Build iOS Apps empfiehlt einen MV-first-Ansatz, vermeidet das unnötige Hinzufügen von View Models und verlagert Side Effects aus body heraus
  • Wichtig ist, eine kleine Validierungsschleife anzuhängen, um zu prüfen, dass sich die UI nicht verändert hat und die Funktionen weiterhin wie zuvor arbeiten
  • Geeignet für: SwiftUI-Screens, in deren body Layout, Verzweigungen, Async-Arbeit und Inline-Actions vermischt sind

40. PRD-Entwürfe aus internem Kontext erstellen (Integrations / Knowledge Work)

Schwierigkeitsgrad: Easy | Zeitaufwand: 30 Min.

  • Sammelt Linear-Projekte, Slack-Planungskanäle, Dokumente in Notion/Google Drive, Meeting-Notizen und Recherchematerial und erstellt daraus ein reviewbares PRD
  • Sinnvoll ist es, einen klaren Abschnittsrahmen für Problem, Nutzer, Anforderungen, UX, technische Überlegungen, Launch-Plan, Timeline, Entscheidungen und offene Fragen vorzugeben
  • Zuerst sollte der Source-Appendix geprüft werden, um zu sehen, welchen Kontext Codex verwendet hat; danach werden Anforderungen und offene Fragen verfeinert
  • Geeignet für: PMs/Produktteams, die Informationen aus internen Teamdiskussionen in PRDs, Proposals, Launch-Briefs oder Decision Memos umwandeln

41. Cashflow prognostizieren (Data / Knowledge Work)

Schwierigkeitsgrad: Intermediate | Zeitaufwand: 30 Min.

  • Erstellt durch Eingabe von beginning cash, expected receipts, payroll, vendor payments, debt, tax, capex, working capital und Timing-Annahmen ein bearbeitbares Cashflow-Forecast-Workbook
  • Bewahrt die ursprüngliche Cadence und lässt einen Summary-Tab erstellen, der Annahmen zeigt, die zu einem Unterschreiten des Sicherheitsbestands oder zu Liquiditätsdruck führen
  • Die erzeugte .xlsx wird in Codex geöffnet, damit Formeln, Szenarien und Timing-Annahmen geprüft und im selben Thread angepasst werden können
  • Geeignet für: Finance-/Operations-Teams, die einen 13-Wochen- oder monatlichen Cash-Forecast erstellen

42. Ein DCF-Bewertungsmodell erstellen (Data / Knowledge Work)

Schwierigkeitsgrad: Intermediate | Zeitaufwand: 30 Min.

  • Erstellt durch Eingabe von historical financials, valuation assumptions und modeling notes ein DCF-Workbook mit revenue growth, margin, capex, working capital, WACC und terminal value
  • Codex erstellt eine bearbeitbare .xlsx mit Modell-Tabellen, Formeln, Annahmen und einer Bewertungszusammenfassung, die Nutzer direkt in Codex prüfen und anpassen können
  • Im selben Thread können anschließend Formelverknüpfungen geprüft, Annahmen geändert, Szenarien ergänzt und das Modell weiter gestrafft werden
  • Geeignet für: Analysten-/Finance-Teams, die schnell ein Bewertungs-Workbook erstellen und prüfen müssen

43. Abgleich von Budget und Ist-Zahlen prüfen (Data / Knowledge Work)

Schwierigkeitsgrad: Easy | Zeitaufwand: 30 Min.

  • Erstellt durch Eingabe von budget plan, actuals export und close notes ein Review-Workbook, das Ist-Zahlen auf Plan-Kategorien abbildet und Abweichungen berechnet
  • Bewahrt die ursprünglichen Inputs, Zuordnungen, Abweichungsformeln und den Summary-Tab und trennt Reconciliation-Probleme von offenen Finanzfragen
  • Anpassungen an der Kategoriezuordnung, zusätzliche Department-Schnitte und das Verfassen eines Entwurfs für die Finanzzusammenfassung können im selben Thread fortgesetzt werden
  • Geeignet für: Finance-Teams, die bei Monatsabschluss-Reviews Abweichungen zwischen Budget und Ausgaben gegenüber dem Management erklären müssen

44. Zielen folgen (Engineering / Automation)

Schwierigkeitsgrad: Advanced | Zeitaufwand: Long-running

  • Mit /goal arbeitet Codex über einen einzelnen Turn hinaus weiter, bis überprüfbare Abschlussbedingungen erreicht sind
  • Objective, Stopping Condition, zuerst zu lesende Dateien/Dokumente/Logs/Pläne sowie Commands oder Artefakte, die Fortschritt belegen, sollten klar angegeben werden
  • Geeignet für Arbeiten wie Migrationen, große Refactors, Deployment-Retry-Loops, Experimente, Spiele oder Prototypen, die Codex checkpointweise eigenständig vorantreiben kann
  • Geeignet für: Coding-Aufgaben, die über mehrere Stunden weiterlaufen müssen, bei denen Ziel und Validierungsschleife aber klar definiert sind

45. Evals zu einer AI-Anwendung hinzufügen (Evaluation / Quality)

Schwierigkeitsgrad: Intermediate | Zeitaufwand: 1 Std.

  • Analysiert Prompt, Model-Call, Tool, Retrieval, Agent und Produktanforderungen einer bestehenden AI-App und fügt eine Promptfoo-Eval-Suite hinzu
  • Statt das gesamte System auf einmal bewerten zu wollen, sollte mit einem einzelnen für Nutzer sichtbaren Verhalten wie classification, extraction, summarization, routing, grounding, tool use oder format rule begonnen werden
  • Codex erstellt Konfiguration und Testdaten, führt Evals lokal aus und hinterlässt Commands, die auch später weiterverwendet werden können
  • Geeignet für: AI-App-Teams, die vor Änderungen an Modell/Prompt/Retrieval/Agent Regressionstests einführen wollen

46. User Stories in UI-Mocks umwandeln (Integrations / Knowledge Work)

Schwierigkeitsgrad: Easy | Zeitaufwand: 30 Min.

  • Sammelt Feedback aus Slack, Linear, Google Drive, Notizen aus Kundengesprächen usw., strukturiert es zu User Stories und Constraints und erzeugt dann mit ImageGen eine Richtung für UI-Mocks
  • Wenn klare User Stories vorliegen, kann direkt begonnen werden; andernfalls sammelt Codex zunächst Kontext und normalisiert Problem und Anforderungen
  • Ausgewählte Mocks werden in einem neuen Turn erneut angehängt und als funktionierender Prototyp umgesetzt, der Designsystem und Komponenten der bestehenden Codebasis wiederverwendet
  • Geeignet für: Produkt-, Design- und Engineering-Teams, die verstreutes Produktfeedback in eine visuelle Richtung überführen und überprüfbare Mocks für das Team brauchen

47. Eine App in ChatGPT bringen (Integrations / Code)

Schwierigkeitsgrad: Advanced | Zeitaufwand: 1 Std.

  • Eine ChatGPT-App rund um ein einziges, klar umrissenes User-Outcome entwerfen und MCP server, optionale Web-Komponente und Tool-Metadaten end-to-end erstellen
  • Codex eignet sich gut dafür, die Gestaltung der Tool-Oberfläche und Metadaten, das Scaffold für den MCP server, die Widget-Implementierung, die Anbindung an ChatGPT und Golden-Prompt-Tests zu übernehmen
  • Bereits in v1 zuerst festlegen, ob ein Widget wirklich nötig ist, ob Authentifizierung und Deployment erforderlich sind und ob sich lokales HTTPS-Testing sowie die Prüfung im Developer Mode durchführen lassen
  • Geeignet für: Teams, die ihre erste ChatGPT-App bauen oder mit MCP server/Tool-Metadaten starten möchten, ohne sie unnötig aufzublähen

48. React-Native-App mit Expo erstellen (Mobile / Engineering)

Schwierigkeitsgrad: Mittel | Dauer: 1h

  • Mit dem Expo-Plugin eine React-Native-App scaffolden und dabei Expo Router, die Expo-native Package-Konvention und schnelle Test-Loops auf Basis von Expo Go nutzen
  • Nur dann zu Dev Client oder EAS Build wechseln, wenn Custom Native Code, Store-Distribution oder von Expo Go nicht unterstützte Capabilities benötigt werden
  • Codex ermöglicht es, einen vollständigen Workflow mit Navigation im Native-Stil sowie Loading-, Empty- und Error-States zu erstellen und auf dem schnellsten Weg zu validieren
  • Geeignet für: Entwickler, die eine Mobile-App mit Expo schnell prototypisieren oder für den Release vorbereiten möchten, bevor sie in nativen IDEs arbeiten

49. Eine CLI erstellen, die Codex verwenden kann (Engineering / Code)

Schwierigkeitsgrad: Mittel | Dauer: 1h

  • APIs, Log-Quellen, Export-Inboxen, lokale DBs und Team-Skripte, auf die Codex wiederholt zugreifen muss, in eine zusammensetzbare CLI kapseln, damit sie in jedem Repo ausgeführt werden kann
  • Eine gute CLI bietet agentenfreundliche Verhaltensweisen wie paged search, exaktes Lesen per ID, vorhersehbares JSON, Download, lokalen Index und draft-before-write
  • Mit $cli-creator die CLI erstellen und mit $skill-creator eine begleitende Skill anlegen, die dokumentiert, wann diese CLI verwendet werden soll
  • Geeignet für: Teams, bei denen Codex dieselben Services oder Datenquellen häufig lesen, durchsuchen und sicher bearbeiten muss

50. Slack-Action-Items priorisieren (Automation / Integrations)

Schwierigkeitsgrad: Einfach | Dauer: 30m

  • Slack-DMs, Gruppen-DMs, Channel-Mentions und Thread-Replys lesen, um direkte Anfragen, implizite Follow-ups, bereits gelöste Punkte und noch offene Actions zu unterscheiden
  • Codex liest bis zum aktuellen Ende eines Threads, bewertet, ob etwas unresolved ist, und erstellt anschließend anhand von Dringlichkeit und Auswirkung eine gerankte Action-Queue
  • Entwürfe für Antworten oder Handoffs können erstellt werden, tatsächliches Posten/Senden sollte aber idealerweise auf Prüfung vor der Ausführung beschränkt bleiben
  • Geeignet für: Workstreams in Launch, Support, Product, Operations und Community, in denen Arbeit über Slack eingeht

51. Verifizierbare Betriebs-Workflows ausführen (Automation / Integrations)

Schwierigkeitsgrad: Mittel | Dauer: 30m

  • Codex wiederkehrende Betriebsaufgaben wie Access-Updates, Invite-Batches, Quota-Änderungen, Customer-Setup, Routing-Checks und Migration-Follow-ups ausführen lassen
  • Input-Tabelle, Approval-Quelle, Policy, auszuführendes Script/API/CLI/Skill, Dry-Run-Status und Retry-Grenzen klar vorgeben und fehlende Felder nicht schätzen lassen
  • Verifizierungsartefakte verlangen, die Menschen prüfen können, etwa Ergebnis-CSV, Log-Datei, Dashboard-Link, Screenshot oder PR-Check
  • Geeignet für: Operative Aufgaben mit strukturierten Eingaben und klaren Freigabe- oder Audit-Spuren

52. Meetings in Folgeaufgaben umwandeln (Automation / Integrations)

Schwierigkeitsgrad: Mittel | Dauer: 5m

  • Zoom-Transkripte und AI Companion Summary nutzen, um zentrale Erkenntnisse, Risiken, Chancen, Entscheidungen und Action-Items aus Kundengesprächen zu strukturieren
  • Codex erstellt Entwürfe für Follow-up-E-Mails, Account-Pläne, CRM-Updates und Slack-Benachrichtigungen, während Versand oder Eintrag erst nach Prüfung durch den Nutzer erfolgen
  • Die Wirkung steigt, wenn Zoom Cloud Recording, Transkript und AI Companion Summary zusammen mit Ziel-Tools wie Gmail, Slack, Google Docs und CRM verbunden werden
  • Geeignet für: kundennahe Teams, die nach Discovery-, Renewal-, Implementation- oder Executive-Sponsor-Calls wiederkehrende Folgeaufgaben bearbeiten müssen

Noch keine Kommentare.

Noch keine Kommentare.