OpenAI führt still und leise „Skills“ ein, nutzbar in ChatGPT und Codex CLI
(simonwillison.net)- Skills sind als Ordner strukturiert, die aus Markdown-Dateien und optionalen Ressourcen bestehen, sodass LLMs das Dateisystem durchsuchen und Funktionen ausführen können
- Zur Code Interpreter-Umgebung von ChatGPT wurde der Ordner
/home/oai/skillshinzugefügt, der Skills für die Verarbeitung von Tabellen, DOCX-Dateien und PDFs enthält - Der PDF-Skill konvertiert Dokumente zunächst seitenweise in PNGs und analysiert sie dann mit einem Vision-Modell, um Layout- und Grafikdaten zu erhalten
- Auch in der Codex CLI wurde experimentell eine Skill-Funktion auf Basis des Ordners
~/.codex/skillsergänzt, sodass Nutzer selbst Skills schreiben und verwenden können - Die leichtgewichtige Struktur der Skills erhöht die Interoperabilität zwischen AI-Tools, zugleich wird die Notwendigkeit einer künftigen Standardisierung thematisiert
Skill-Funktion in ChatGPT
- In der Code Interpreter-Umgebung von ChatGPT wurde der Ordner
/home/oai/skillsentdeckt- Elias Judin hat dies zuerst festgestellt; gibt man per Prompt
Create a zip file of /home/oai/skillsein, kann man den Ordnerinhalt als ZIP-Datei erhalten - Simon Willison hat das selbst ausprobiert, die ZIP-Datei veröffentlicht und eine Web-UI zum Durchsuchen bereitgestellt
- Elias Judin hat dies zuerst festgestellt; gibt man per Prompt
- Die enthaltenen Skills decken Funktionen für Tabellen, DOCX und PDFs ab
- Die PDF- und Dokument-Skills rendern Dateien seiteweise als PNG und übergeben sie dann an ein Vision-Modell, wodurch Layout-Informationen erhalten bleiben, die bei einer reinen Textextraktion verloren gehen könnten
- Elias Judin hat auf GitHub eine Kopie der Skills geteilt; deren Struktur ähnelt dem Anthropic-Repository
anthropics/skills - Bei einer Anfrage in ChatGPT wie „Erstelle eine zusammenfassende PDF zum Zustand des Rimu-Baums und zur Brutzeit des Kakapo“ hat das Modell GPT-5.2 auf
skill.mdverwiesen, um die Anweisungen zur PDF-Erstellung zu lesen, anschließend relevante Informationen gesucht und daraus ein PDF erzeugt- Der Vorgang dauerte etwa 11 Minuten; als die Schriftart keine Macron-Zeichen unterstützte, wurde automatisch auf eine andere Schriftart umgestellt, was einen selbstprüfenden Arbeitsablauf zeigte
Skill-Unterstützung in der Codex CLI
- In OpenAIs Open-Source-Tool Codex CLI wurde ein PR zusammengeführt, der Unterstützung für
skills.mdenthält- Laut Dokumentation wird jedes Verzeichnis im Ordner
~/.codex/skillsals Skill erkannt - Der zugehörige Code ist in
codex-rs/core/src/skills/render.rsimplementiert
- Laut Dokumentation wird jedes Verzeichnis im Ordner
- Simon Willison nutzte die Skill-Erstellungsfunktion von Claude Opus 4.5, um einen Skill zur Erstellung von Datasette-Plugins zu bauen, und installierte ihn in der Codex CLI
- Mit dem Befehl
codex --enable skills -m gpt-5.2lässt sich die Skill-Funktion aktivieren, und mitlist skillskann die Liste der installierten Skills angezeigt werden - Codex erkannte den Skill „Datasette-Plugin schreiben“ und erzeugte auf Anforderung automatisch Plugin-Code, der die Seite / - /cowsay?text=hello hinzufügt
- Der erzeugte Code wurde auf GitHub veröffentlicht und kann direkt mit dem Befehl
uvxausgeführt werden
- Mit dem Befehl
Bedeutung des Skill-Konzepts
- Nach der Einführung von Claude Skills im Oktober 2025 hat OpenAI diese nur zwei Monate später in ChatGPT und Codex integriert
- Skills bestehen aus einer sehr einfachen Spezifikation, funktionieren jedoch als teilbare Ausführungseinheiten zwischen verschiedenen AI-Tools
- Der Autor erwähnt, dass diese Struktur über Institutionen wie die Agentic AI Foundation offiziell dokumentiert werden sollte
- OpenAIs Übernahme wird als Beispiel gewertet, das die Möglichkeit einer Standardisierung skill-basierter AI-Interoperabilität erhöht
1 Kommentare
Hacker-News-Kommentare
Es ist bemerkenswert, wie Anthropic weiterhin einfache, aber intuitive Innovationen hervorbringt.
MCP kann man kaum überhaupt ein Protokoll nennen, und obwohl Skills nur einfache md-Dateien sind, ist ihre Fähigkeit zum Framing herausragend.
Stand heute wurde an OpenAI-Plus-Abonnenten eine öffentliche Warnung verschickt.
Es werden 196k Token Kontext beworben, tatsächlich wird aber bei Eingaben über 50.000 Token abgeschnitten.
Dasselbe Problem gab es schon früher bei GPT-5.0, und jetzt tritt es erneut auf.
Siehe den offiziellen Hilfelink.
Es hat Spaß gemacht, in diesem Beitrag auch über die Kākāpō-Brutsaison schreiben zu können.
(Es geht nicht nur um Pelikane.)
Andererseits könnte sie auch missbraucht werden, daher könnten Unternehmen damit vorsichtig sein.
Ich frage mich, ob das jemand auch schon mit lokalen LLMs ausprobiert hat.
Das Konzept von „Skill“ ist noch nicht ganz klar.
Es wirkt einfach wie ein Werkzeug zur Kontextverwaltung. Ist es korrekt zu verstehen, dass anhand der Beschreibung entschieden wird, ob das Modell es braucht, und dann die zugehörigen Skripte oder Dokumente geladen werden?
Beispiel: „Verwende den Image Manipulation skill, um aus image.png ein Icon zu machen.“
Ich lasse Claude auch seine eigenen Skills schreiben. Mein Skill-Template ist auf GitHub veröffentlicht.
Diese Struktur fühlt sich an wie die UNIX-Philosophie, bei der kleine Werkzeuge in einer Pipeline verbunden werden.
Ich weise oft ausdrücklich an: „Lade den wireframe-skill und führe X aus.“
Im Vergleich zu progressive loading fühlt es sich präziser an, alle Referenzen auf einmal zu laden.
Besonders ein Debugging-Skill verhindert, dass die AI in Schleifen gerät.
Technisch gesehen ist ein Skill ein automatisiertes Prompt-Injection-System.
Es ist eine vereinfachte Form dessen, was die meisten AI-Wrapper-Apps tun (Prompt Injection + RAG + MCP).
Es wurde @simonw dafür gedankt, dass er Bildern immer Alt-Text hinzufügt.
Es wurde gefragt, ob es einen grundlegenden Unterschied zwischen Skill und Tool gibt. Ob man einen kurzen Skill bauen und wie ein Tool verwenden kann.
Wer Skills auch mit anderen Modellen (z. B. Gemini CLI) nutzen will, kann mein open-skills verwenden.
Allerdings wird ein Mac benötigt, es läuft in einem lokalen Container und ist nicht von der Cloud abhängig.
Das Vorstellungsvideo zu Anthropics Skills-Designphilosophie wurde veröffentlicht.
Siehe den YouTube-Link.
Die zunehmend komplexere Struktur ist verwirrend.
Früher wurde der Kontext mit agents.md erweitert, jetzt muss man noch eine weitere md-Datei hinzufügen.