16 Punkte von GN⁺ 2025-12-22 | 1 Kommentare | Auf WhatsApp teilen
  • Agent Skills sind eine Erweiterungsstruktur, die Codex aufgabenspezifische Fachkompetenzen hinzufügt, damit bestimmte Workflows zuverlässig ausgeführt werden können
  • Jeder Skill besteht aus einer Datei SKILL.md sowie optionalen Skripten, Ressourcen und Assets und kann so zwischen Teams oder in der Community geteilt werden
  • Codex führt Skills über expliziten Aufruf (/skills-Befehl oder $-Eingabe) und impliziten Aufruf (automatische Nutzung bei passender Aufgabenbeschreibung) aus
  • Skills werden über mehrere Speicherorte und Prioritätsebenen wie REPO, USER, ADMIN, SYSTEM verwaltet; neue Skills lassen sich mit $skill-creator erstellen
  • Diese Funktion ist sowohl in der CLI als auch in der IDE-Erweiterung verfügbar; zudem lassen sich Skills etwa von GitHub installieren, um den Funktionsumfang zu erweitern

Überblick über Agent Skills

  • Agent Skills sind eine Struktur, die Codex neue Funktionen und Fachwissen verleiht
    • Skills bündeln Anweisungen, Ressourcen und optionale Skripte für die Ausführung bestimmter Aufgaben
    • Sie können zwischen Teams oder in der Community geteilt werden und basieren auf dem open Agent Skills standard
  • Sie sind sowohl in der CLI als auch in der IDE-Erweiterung von Codex nutzbar

Skill-Struktur und Bestandteile

  • Jeder Skill ist um die Datei SKILL.md herum aufgebaut und hat die folgende Ordnerstruktur
    • SKILL.md: erforderlich, enthält Anweisungen und Metadaten
    • scripts/: optionaler ausführbarer Code
    • references/: optionale Dokumentation
    • assets/: optionale Templates und Ressourcen
  • Codex verwendet progressive disclosure, um den Kontext effizient zu verwalten
    • Beim Start werden nur Name und Beschreibung des Skills geladen; bei Bedarf werden die vollständigen Anweisungen eingelesen

Arten des Skill-Aufrufs

  • Expliziter Aufruf (Explicit invocation)
    • Ein Skill wird direkt über den /skills-Befehl oder per $-Eingabe angegeben
    • Die Codex-Web- und iOS-Version unterstützen den expliziten Aufruf noch nicht, aber im Repository enthaltene Skills können per Prompt verwendet werden
  • Impliziter Aufruf (Implicit invocation)
    • Wenn die Aufgabe des Nutzers zur Beschreibung eines Skills passt, verwendet Codex diesen automatisch

Speicherorte und Priorität von Skills

  • Codex lädt Skills aus mehreren Orten; Skills an höher priorisierten Orten überschreiben gleichnamige Skills niedrigerer Ebenen
  • Wichtige Scopes und Speicherorte
    • REPO: $CWD/.codex/skills, $CWD/../.codex/skills, $REPO_ROOT/.codex/skills
    • USER: $CODEX_HOME/skills oder ~/.codex/skills
    • ADMIN: /etc/codex/skills
    • SYSTEM: standardmäßig in Codex enthaltene Skills
  • Jeder Scope dient je nach Zweck der Verwaltung auf persönlicher, Team- oder Systemebene

So erstellt man Skills

  • Mit dem eingebauten Skill $skill-creator lassen sich neue Skills automatisch erzeugen
    • In Kombination mit dem $plan-Skill kann vor der Erstellung zuerst ein Plan ausgearbeitet werden
  • Bei manueller Erstellung wird an einem gültigen Ort ein Ordner angelegt und eine Datei SKILL.md geschrieben
    • Pflichtfelder: name, description
    • Optionale Felder: metadata.short-description
  • Skills basieren auf der Agent Skills specification

Installation von Skills und Beispiele

  • Mit dem Skill $skill-installer lassen sich Skills aus dem öffentlichen Skill-Repository auf GitHub installieren
    • Beispiel: $skill-installer linear
    • Auch Skills aus anderen Repositories können installiert werden
  • Beispiele für eingebaute Skills
    • $plan: Planung für die Entwicklung neuer Funktionen oder die Lösung komplexer Probleme
    • $skill-installer linear: Zugriff auf Linear-Kontext
    • $skill-installer notion-spec-to-implementation: Zugriff auf Notion-Daten

Bedeutung für Codex-Entwickler

  • Agent Skills sind ein zentrales Element, um die Erweiterbarkeit und Kollaboration von Codex zu steigern
  • Entwickler können eigene Skills definieren und damit automatisierte Entwicklungs-Workflows aufbauen
  • CLI-/IDE-Integration, GitHub-Anbindung und eine standardisierte Skill-Spezifikation stärken das Erweiterungspotenzial des Codex-Ökosystems

1 Kommentare

 
GN⁺ 2025-12-22
Hacker-News-Kommentare
  • Es freut mich wirklich, dass sich Skills als Standard etablieren
    Man kann sie einfach als Markdown-Dateien schreiben, und sie sind von Haus aus kontexteffizient
    Man kann sie auf bestehende Tools aufsetzen, also zum Beispiel statt GitHub MCP einen Skill bauen, der erklärt, wie man die gh CLI benutzt
    Mehrere Skills lassen sich kombinieren, und auch Python- oder JS-Skripte können eingebunden werden
    Dadurch wird ein viel einfacherer und flexiblerer Ansatz möglich, ohne einen separaten MCP-Server exponieren zu müssen

    • Dazu kommt, dass der Agent selbst Skills bearbeiten, verbessern und hinzufügen kann
      So lässt sich zum Beispiel etwas wie „Füge die Kernpunkte dieser Session als Skill hinzu“ automatisieren
      Nicht nur gute Sessions, sondern auch Sessions mit viel Trial-and-Error können ihre Lernergebnisse als Skill hinterlassen
      Das bietet einen Ablauf zur Funktionserweiterung, der viel schneller und zugänglicher ist als MCP
    • Ich überlege gerade, wie man Skills in einer mittelgroßen Django + PostgreSQL + Python-Web-App nutzen könnte
      Vielleicht sind sie eher im Bereich Data Science oder DevOps nützlich als für CRUD-lastige Arbeit
    • Letztlich verstehe ich Skills als etwas wie Caching von Use-Case-/Workflow-Rezepten
  • Der Kern von Skills ist, dass laut Spezifikation auf den Hauptinhalt von Skill-Code oder Markdown kein RAG angewendet wird
    Das heißt, nur Name und Beschreibung im Front-Matter kommen in den Prompt und werden für die Skill-Auswahl verwendet
    Logik, die in der Beschreibung nicht erwähnt wird, könnte deshalb überhaupt nicht entdeckt werden
    Außerdem ist die Skill-Beschreibung eine Art Prompt Injection, was sich auch auf den Gesamttenor und die Token-Kosten auswirkt
    Ein passendes Beispiel findet sich unter diesem Code-Link

    • Ich persönlich habe das Gefühl, dass ein Skill-Index eher Belastung als Hilfe sein könnte
      Es ist wichtig, den Context sauber zu halten, deshalb ziehe ich es vor, bei Bedarf die md-Datei direkt hinzuzufügen
      MCP ist übermäßig komplex, und selbst Skills wirken ein wenig overengineered
    • Einige agentische Systeme wenden RAG auf Skills an
      Das ist eher ein Problem des Designs des agentischen Harness als des LLM selbst
      In Zukunft werden LLM und Harness wohl enger integriert sein
    • MCPs und Tools haben am Ende dasselbe Problem
  • Ich nutze schon länger einen ähnlichen Ansatz
    Ich erstelle für jede Funktion einen Ordner mit README.md, scripts und GUIDE.md
    Wenn ich wiederverwendbaren Code finde, zum Beispiel für eine clerk.dev-Integration, lege ich ihn in einem Ordner ab
    und habe ihn bei Bedarf mit merge-to-md zusammengeführt
    Dieser Ansatz hat perfekt funktioniert, deshalb freut es mich, dass so etwas jetzt standardmäßig im Agenten steckt

    • Mit dieser Erklärung ist das Skill-Konzept leicht verständlich
  • Skills könnten sich langfristig wie Open-Source-Bibliotheken entwickeln
    Wenn standardisierte Lösungen für Authentifizierung oder Multitenancy als Skills bereitgestellt werden,
    würden sich Sicherheit und Codequalität stark verbessern

    • Wenn ein Modell künftig im globalen Skill-Index die nötigen Skills suchen und herunterladen
      und sofort verwenden kann, könnte das sogar eine Alternative zu kontinuierlichem Lernen sein
  • Skills, Plugins, Apps, Connectors, MCPs, Agents … ehrlich gesagt ist das verwirrend

    • Diese Verwirrung kommt von der Unreife der Technologie und ihrem schnellen Wandel
      Der beste Ansatz ist noch nicht entschieden, und auch die Begriffe sind nicht geordnet
      Sogar „Agent“ bedeutet je nach Gruppe etwas anderes
    • Im Grunde ist das alles nur ein Hilfsmittel, um Context zu laden
      Abgesehen von Tool-Ausführung sind es einfach verschiedene Wege, dem Prompt Kontext hinzuzufügen
    • Manche nennen das alles einen provisorischen Flicken (bandaid)
    • Andere sehen darin nur Marketingnamen für API und Prompt
    • Es erinnert auch an das Phänomen, dass LLMs massenhaft ähnliche, aber leicht unterschiedliche Ideen erzeugen
  • In diesem Beitrag wurde vor Kurzem erklärt,
    wie ein Agent das LLM wiederholt aufruft und dabei in JSON-Form Anfragen zur Tool-Nutzung austauscht;
    ich frage mich, welche Form Skills in diesem Framework hätten

    • Vor der ersten Schleife sendet das Harness einen <Skills>-Block an das LLM
      Beispiel: <Skill><Name>postgres</Name><Description>Wie man die Pre-Prod-DB abfragt</Description><File>skills/postgres.md</File></Skill>
      Diese Information wird regelmäßig erneut gesendet, damit das LLM die Skills nicht „vergisst“
      Letztlich werden nur Name + Beschreibung + Dateipfad übertragen, daher sind die Token-Kosten gering
      Aber ein hinreichend kluges LLM könnte vielleicht auch ohne diese Struktur gut funktionieren
    • Der Agent lädt bei Bedarf selektiv einen oder mehrere Skills
      Das ist eine standardisierte Methode, den Prompt des Skills und passende Skripte gemeinsam zu laden und zu verwenden
  • Viele missverstehen Skills
    Der Kern ist nicht die .md-Datei, sondern das Bündeln von Code und Anweisungen
    Skills setzen eine Umgebung zur Codeausführung voraus

    • Vorab genehmigter ausführbarer Code kann bei Bedarf aus dem Prompt heraus aufgerufen werden
      Metadaten-Indizierung und Lazy Loading sparen dabei besonders viel Context
    • Manche beschreiben das als Wiederauferstehung des Literate Programming
  • Ein skills.md-Marktplatz könnte helfen, die Technologie weiter zu verbreiten

    • Realistisch gesehen wäre der Betrieb aber wegen Spam, Sicherheit und fehlender Rentabilität schwierig
      Das sieht man schon an Spam-Fällen rund um MCP
      Wahrscheinlich würde so etwas am Ende nur von vertrauenswürdigen Unternehmen oder bekannten Entwicklern getragen
    • Es gibt bereits Anthropics Skill-Repository
      Es hat zwar keine Bewertungen oder Kommentare, aber von der Qualität kann man wohl etwas erwarten
    • Solche Versuche tauchen immer wieder auf, aber weil die Kosten für maßgeschneiderte Skills fast null sind,
      gibt es wenig Anreiz, die Prompts anderer zu verwenden
    • Ich habe mir mit den Anthropic-Dokumenten auch einen Skill zum Schreiben von Skills gebaut
      Am wichtigsten ist am Ende die Optimierung auf den eigenen Workflow und die eigene Codebasis
  • Ich frage mich, ob ein Agent mithilfe erzeugter Skills die endgültige Lösung nach mehreren Versuchen zusammenfassen kann

    • Ich habe ebenfalls einen „Meta-Skill“, der nach Abschluss einer Session seine Regeln selbst aktualisiert
      So baue ich eine Art Flywheel-Effekt auf
  • Es gab den Scherz, Anthropic wirke wie der Chief Product Officer von OpenAI

    • Darauf folgte noch der Zusatzwitz: „ohne Bezahlung“