Offiziell in Codex eingeführte Skills
(developers.openai.com)- Agent Skills sind eine Erweiterungsstruktur, die Codex aufgabenspezifische Fachkompetenzen hinzufügt, damit bestimmte Workflows zuverlässig ausgeführt werden können
- Jeder Skill besteht aus einer Datei
SKILL.mdsowie optionalen Skripten, Ressourcen und Assets und kann so zwischen Teams oder in der Community geteilt werden - Codex führt Skills über expliziten Aufruf (
/skills-Befehl oder$-Eingabe) und impliziten Aufruf (automatische Nutzung bei passender Aufgabenbeschreibung) aus - Skills werden über mehrere Speicherorte und Prioritätsebenen wie REPO, USER, ADMIN, SYSTEM verwaltet; neue Skills lassen sich mit
$skill-creatorerstellen - Diese Funktion ist sowohl in der CLI als auch in der IDE-Erweiterung verfügbar; zudem lassen sich Skills etwa von GitHub installieren, um den Funktionsumfang zu erweitern
Überblick über Agent Skills
- Agent Skills sind eine Struktur, die Codex neue Funktionen und Fachwissen verleiht
- Skills bündeln Anweisungen, Ressourcen und optionale Skripte für die Ausführung bestimmter Aufgaben
- Sie können zwischen Teams oder in der Community geteilt werden und basieren auf dem open Agent Skills standard
- Sie sind sowohl in der CLI als auch in der IDE-Erweiterung von Codex nutzbar
Skill-Struktur und Bestandteile
- Jeder Skill ist um die Datei
SKILL.mdherum aufgebaut und hat die folgende OrdnerstrukturSKILL.md: erforderlich, enthält Anweisungen und Metadatenscripts/: optionaler ausführbarer Codereferences/: optionale Dokumentationassets/: optionale Templates und Ressourcen
- Codex verwendet progressive disclosure, um den Kontext effizient zu verwalten
- Beim Start werden nur Name und Beschreibung des Skills geladen; bei Bedarf werden die vollständigen Anweisungen eingelesen
Arten des Skill-Aufrufs
- Expliziter Aufruf (Explicit invocation)
- Ein Skill wird direkt über den
/skills-Befehl oder per$-Eingabe angegeben - Die Codex-Web- und iOS-Version unterstützen den expliziten Aufruf noch nicht, aber im Repository enthaltene Skills können per Prompt verwendet werden
- Ein Skill wird direkt über den
- Impliziter Aufruf (Implicit invocation)
- Wenn die Aufgabe des Nutzers zur Beschreibung eines Skills passt, verwendet Codex diesen automatisch
Speicherorte und Priorität von Skills
- Codex lädt Skills aus mehreren Orten; Skills an höher priorisierten Orten überschreiben gleichnamige Skills niedrigerer Ebenen
- Wichtige Scopes und Speicherorte
REPO:$CWD/.codex/skills,$CWD/../.codex/skills,$REPO_ROOT/.codex/skillsUSER:$CODEX_HOME/skillsoder~/.codex/skillsADMIN:/etc/codex/skillsSYSTEM: standardmäßig in Codex enthaltene Skills
- Jeder Scope dient je nach Zweck der Verwaltung auf persönlicher, Team- oder Systemebene
So erstellt man Skills
- Mit dem eingebauten Skill
$skill-creatorlassen sich neue Skills automatisch erzeugen- In Kombination mit dem
$plan-Skill kann vor der Erstellung zuerst ein Plan ausgearbeitet werden
- In Kombination mit dem
- Bei manueller Erstellung wird an einem gültigen Ort ein Ordner angelegt und eine Datei
SKILL.mdgeschrieben- Pflichtfelder:
name,description - Optionale Felder:
metadata.short-description
- Pflichtfelder:
- Skills basieren auf der Agent Skills specification
Installation von Skills und Beispiele
- Mit dem Skill
$skill-installerlassen sich Skills aus dem öffentlichen Skill-Repository auf GitHub installieren- Beispiel:
$skill-installer linear - Auch Skills aus anderen Repositories können installiert werden
- Beispiel:
- Beispiele für eingebaute Skills
$plan: Planung für die Entwicklung neuer Funktionen oder die Lösung komplexer Probleme$skill-installer linear: Zugriff auf Linear-Kontext$skill-installer notion-spec-to-implementation: Zugriff auf Notion-Daten
Bedeutung für Codex-Entwickler
- Agent Skills sind ein zentrales Element, um die Erweiterbarkeit und Kollaboration von Codex zu steigern
- Entwickler können eigene Skills definieren und damit automatisierte Entwicklungs-Workflows aufbauen
- CLI-/IDE-Integration, GitHub-Anbindung und eine standardisierte Skill-Spezifikation stärken das Erweiterungspotenzial des Codex-Ökosystems
1 Kommentare
Hacker-News-Kommentare
Es freut mich wirklich, dass sich Skills als Standard etablieren
Man kann sie einfach als Markdown-Dateien schreiben, und sie sind von Haus aus kontexteffizient
Man kann sie auf bestehende Tools aufsetzen, also zum Beispiel statt GitHub MCP einen Skill bauen, der erklärt, wie man die
ghCLI benutztMehrere Skills lassen sich kombinieren, und auch Python- oder JS-Skripte können eingebunden werden
Dadurch wird ein viel einfacherer und flexiblerer Ansatz möglich, ohne einen separaten MCP-Server exponieren zu müssen
So lässt sich zum Beispiel etwas wie „Füge die Kernpunkte dieser Session als Skill hinzu“ automatisieren
Nicht nur gute Sessions, sondern auch Sessions mit viel Trial-and-Error können ihre Lernergebnisse als Skill hinterlassen
Das bietet einen Ablauf zur Funktionserweiterung, der viel schneller und zugänglicher ist als MCP
Vielleicht sind sie eher im Bereich Data Science oder DevOps nützlich als für CRUD-lastige Arbeit
Der Kern von Skills ist, dass laut Spezifikation auf den Hauptinhalt von Skill-Code oder Markdown kein RAG angewendet wird
Das heißt, nur Name und Beschreibung im Front-Matter kommen in den Prompt und werden für die Skill-Auswahl verwendet
Logik, die in der Beschreibung nicht erwähnt wird, könnte deshalb überhaupt nicht entdeckt werden
Außerdem ist die Skill-Beschreibung eine Art Prompt Injection, was sich auch auf den Gesamttenor und die Token-Kosten auswirkt
Ein passendes Beispiel findet sich unter diesem Code-Link
Es ist wichtig, den Context sauber zu halten, deshalb ziehe ich es vor, bei Bedarf die md-Datei direkt hinzuzufügen
MCP ist übermäßig komplex, und selbst Skills wirken ein wenig overengineered
Das ist eher ein Problem des Designs des agentischen Harness als des LLM selbst
In Zukunft werden LLM und Harness wohl enger integriert sein
Ich nutze schon länger einen ähnlichen Ansatz
Ich erstelle für jede Funktion einen Ordner mit
README.md,scriptsundGUIDE.mdWenn ich wiederverwendbaren Code finde, zum Beispiel für eine clerk.dev-Integration, lege ich ihn in einem Ordner ab
und habe ihn bei Bedarf mit merge-to-md zusammengeführt
Dieser Ansatz hat perfekt funktioniert, deshalb freut es mich, dass so etwas jetzt standardmäßig im Agenten steckt
Skills könnten sich langfristig wie Open-Source-Bibliotheken entwickeln
Wenn standardisierte Lösungen für Authentifizierung oder Multitenancy als Skills bereitgestellt werden,
würden sich Sicherheit und Codequalität stark verbessern
und sofort verwenden kann, könnte das sogar eine Alternative zu kontinuierlichem Lernen sein
Skills, Plugins, Apps, Connectors, MCPs, Agents … ehrlich gesagt ist das verwirrend
Der beste Ansatz ist noch nicht entschieden, und auch die Begriffe sind nicht geordnet
Sogar „Agent“ bedeutet je nach Gruppe etwas anderes
Abgesehen von Tool-Ausführung sind es einfach verschiedene Wege, dem Prompt Kontext hinzuzufügen
In diesem Beitrag wurde vor Kurzem erklärt,
wie ein Agent das LLM wiederholt aufruft und dabei in JSON-Form Anfragen zur Tool-Nutzung austauscht;
ich frage mich, welche Form Skills in diesem Framework hätten
<Skills>-Block an das LLMBeispiel:
<Skill><Name>postgres</Name><Description>Wie man die Pre-Prod-DB abfragt</Description><File>skills/postgres.md</File></Skill>Diese Information wird regelmäßig erneut gesendet, damit das LLM die Skills nicht „vergisst“
Letztlich werden nur Name + Beschreibung + Dateipfad übertragen, daher sind die Token-Kosten gering
Aber ein hinreichend kluges LLM könnte vielleicht auch ohne diese Struktur gut funktionieren
Das ist eine standardisierte Methode, den Prompt des Skills und passende Skripte gemeinsam zu laden und zu verwenden
Viele missverstehen Skills
Der Kern ist nicht die
.md-Datei, sondern das Bündeln von Code und AnweisungenSkills setzen eine Umgebung zur Codeausführung voraus
Metadaten-Indizierung und Lazy Loading sparen dabei besonders viel Context
Ein skills.md-Marktplatz könnte helfen, die Technologie weiter zu verbreiten
Das sieht man schon an Spam-Fällen rund um MCP
Wahrscheinlich würde so etwas am Ende nur von vertrauenswürdigen Unternehmen oder bekannten Entwicklern getragen
Es hat zwar keine Bewertungen oder Kommentare, aber von der Qualität kann man wohl etwas erwarten
gibt es wenig Anreiz, die Prompts anderer zu verwenden
Am wichtigsten ist am Ende die Optimierung auf den eigenen Workflow und die eigene Codebasis
Ich frage mich, ob ein Agent mithilfe erzeugter Skills die endgültige Lösung nach mehreren Versuchen zusammenfassen kann
So baue ich eine Art Flywheel-Effekt auf
Es gab den Scherz, Anthropic wirke wie der Chief Product Officer von OpenAI