4 Punkte von GN⁺ 2025-12-13 | 1 Kommentare | Auf WhatsApp teilen
  • Skills sind als Ordner strukturiert, die aus Markdown-Dateien und optionalen Ressourcen bestehen, sodass LLMs das Dateisystem durchsuchen und Funktionen ausführen können
  • Zur Code Interpreter-Umgebung von ChatGPT wurde der Ordner /home/oai/skills hinzugefügt, der Skills für die Verarbeitung von Tabellen, DOCX-Dateien und PDFs enthält
  • Der PDF-Skill konvertiert Dokumente zunächst seitenweise in PNGs und analysiert sie dann mit einem Vision-Modell, um Layout- und Grafikdaten zu erhalten
  • Auch in der Codex CLI wurde experimentell eine Skill-Funktion auf Basis des Ordners ~/.codex/skills ergänzt, sodass Nutzer selbst Skills schreiben und verwenden können
  • Die leichtgewichtige Struktur der Skills erhöht die Interoperabilität zwischen AI-Tools, zugleich wird die Notwendigkeit einer künftigen Standardisierung thematisiert

Skill-Funktion in ChatGPT

  • In der Code Interpreter-Umgebung von ChatGPT wurde der Ordner /home/oai/skills entdeckt
    • Elias Judin hat dies zuerst festgestellt; gibt man per Prompt Create a zip file of /home/oai/skills ein, kann man den Ordnerinhalt als ZIP-Datei erhalten
    • Simon Willison hat das selbst ausprobiert, die ZIP-Datei veröffentlicht und eine Web-UI zum Durchsuchen bereitgestellt
  • Die enthaltenen Skills decken Funktionen für Tabellen, DOCX und PDFs ab
    • Die PDF- und Dokument-Skills rendern Dateien seiteweise als PNG und übergeben sie dann an ein Vision-Modell, wodurch Layout-Informationen erhalten bleiben, die bei einer reinen Textextraktion verloren gehen könnten
  • Elias Judin hat auf GitHub eine Kopie der Skills geteilt; deren Struktur ähnelt dem Anthropic-Repository anthropics/skills
  • Bei einer Anfrage in ChatGPT wie „Erstelle eine zusammenfassende PDF zum Zustand des Rimu-Baums und zur Brutzeit des Kakapo“ hat das Modell GPT-5.2 auf skill.md verwiesen, um die Anweisungen zur PDF-Erstellung zu lesen, anschließend relevante Informationen gesucht und daraus ein PDF erzeugt
    • Der Vorgang dauerte etwa 11 Minuten; als die Schriftart keine Macron-Zeichen unterstützte, wurde automatisch auf eine andere Schriftart umgestellt, was einen selbstprüfenden Arbeitsablauf zeigte
Anzeige

Skill-Unterstützung in der Codex CLI

  • In OpenAIs Open-Source-Tool Codex CLI wurde ein PR zusammengeführt, der Unterstützung für skills.md enthält
    • Laut Dokumentation wird jedes Verzeichnis im Ordner ~/.codex/skills als Skill erkannt
    • Der zugehörige Code ist in codex-rs/core/src/skills/render.rs implementiert
  • Simon Willison nutzte die Skill-Erstellungsfunktion von Claude Opus 4.5, um einen Skill zur Erstellung von Datasette-Plugins zu bauen, und installierte ihn in der Codex CLI
    • Mit dem Befehl codex --enable skills -m gpt-5.2 lässt sich die Skill-Funktion aktivieren, und mit list skills kann die Liste der installierten Skills angezeigt werden
    • Codex erkannte den Skill „Datasette-Plugin schreiben“ und erzeugte auf Anforderung automatisch Plugin-Code, der die Seite / - /cowsay?text=hello hinzufügt
    • Der erzeugte Code wurde auf GitHub veröffentlicht und kann direkt mit dem Befehl uvx ausgeführt werden

Bedeutung des Skill-Konzepts

  • Nach der Einführung von Claude Skills im Oktober 2025 hat OpenAI diese nur zwei Monate später in ChatGPT und Codex integriert
  • Skills bestehen aus einer sehr einfachen Spezifikation, funktionieren jedoch als teilbare Ausführungseinheiten zwischen verschiedenen AI-Tools
  • Der Autor erwähnt, dass diese Struktur über Institutionen wie die Agentic AI Foundation offiziell dokumentiert werden sollte
  • OpenAIs Übernahme wird als Beispiel gewertet, das die Möglichkeit einer Standardisierung skill-basierter AI-Interoperabilität erhöht

1 Kommentare

 
GN⁺ 2025-12-13
Hacker-News-Kommentare
  • Es ist bemerkenswert, wie Anthropic weiterhin einfache, aber intuitive Innovationen hervorbringt.
    MCP kann man kaum überhaupt ein Protokoll nennen, und obwohl Skills nur einfache md-Dateien sind, ist ihre Fähigkeit zum Framing herausragend.

    • Wenn man sich die Ankündigung zu Anthropics MCP-Spende und der Gründung der Agentic AI Foundation ansieht, ist interessant, wie ein vor einem Jahr geschaffenes Protokoll als „Foundation“ verpackt wurde. Das hat etwas Gavin-Belson-artige Tech-Unternehmens-Energie.
    • Anthropic wirkt wie Menschen, die mit LLMs im Einklang stehen. So wie Nagel versuchte, die Wahrnehmung einer Fledermaus zu verstehen, scheinen sie das Team zu sein, das die Wahrnehmung von Frontier-AI-Modellen am besten versteht.
    • Allerdings ist MCP so simpel, dass es auch zu einer Sicherheitskatastrophe werden könnte.
    • Schon der Firmenname „Anthropic“ deutet darauf hin, dass die Vermenschlichung von AI zu ihrer Identität gehört. MCP, Skills usw. scheinen alle aus einer konsistenten Philosophie in diese Richtung zu kommen.
    • Selbst in der Android-App spürt man Claudes elegante UX. Wenn man etwa einen Absatz bearbeitet, erscheint erst dann ein Button, mit dem man ihn als Nachricht senden kann — ein sehr geschliffener Ablauf.
  • Stand heute wurde an OpenAI-Plus-Abonnenten eine öffentliche Warnung verschickt.
    Es werden 196k Token Kontext beworben, tatsächlich wird aber bei Eingaben über 50.000 Token abgeschnitten.
    Dasselbe Problem gab es schon früher bei GPT-5.0, und jetzt tritt es erneut auf.
    Siehe den offiziellen Hilfelink.

    • Und die Xhigh-Version ist nur für die API, in ChatGPT kann sie nicht verwendet werden.
  • Es hat Spaß gemacht, in diesem Beitrag auch über die Kākāpō-Brutsaison schreiben zu können.
    (Es geht nicht nur um Pelikane.)

    • Deshalb ist der Kākāpō Benchmark entstanden.
    • Heute habe ich zum ersten Mal von einem großen grünen flugunfähigen Papagei erfahren.
    • Es wurde gescherzt, ob irgendwann der Tag kommt, an dem ein Kākāpō Fahrrad fährt.
    • Skills sind eine gute Idee, aber die Spezifikation ist so leichtgewichtig, dass ich denke, sie braucht offizielle Dokumentation.
      Andererseits könnte sie auch missbraucht werden, daher könnten Unternehmen damit vorsichtig sein.
      Ich frage mich, ob das jemand auch schon mit lokalen LLMs ausprobiert hat.
  • Das Konzept von „Skill“ ist noch nicht ganz klar.
    Es wirkt einfach wie ein Werkzeug zur Kontextverwaltung. Ist es korrekt zu verstehen, dass anhand der Beschreibung entschieden wird, ob das Modell es braucht, und dann die zugehörigen Skripte oder Dokumente geladen werden?

    • Ein Skill ist im Grunde eine Struktur aus Ordner + Markdown-Datei. Ein Beispiel findet sich im Datasette plugin skill. Beim Start scannt Claude Code alle Skill-Ordner, legt nur die Beschreibungen in den Kontext und lädt den vollständigen Inhalt bei Bedarf nach.
    • Claude Code erinnert sich manchmal nicht an seine eigenen Skills. Deshalb lade ich sie gelegentlich manuell.
      Beispiel: „Verwende den Image Manipulation skill, um aus image.png ein Icon zu machen.“
      Ich lasse Claude auch seine eigenen Skills schreiben. Mein Skill-Template ist auf GitHub veröffentlicht.
    • Ein Skill kann auch einen MCP-Server ersetzen. Statt etwa eines MCP-Servers, der CI-Build-Ergebnisse abruft, kann man dieselbe Funktion mit einem einfachen Skript und einer SKILL.md umsetzen.
      Diese Struktur fühlt sich an wie die UNIX-Philosophie, bei der kleine Werkzeuge in einer Pipeline verbunden werden.
    • Meinem Verständnis nach ist die SKILL.md das zentrale Dokument, das Claude sagt, wann welche Aktion auszuführen ist.
      Ich weise oft ausdrücklich an: „Lade den wireframe-skill und führe X aus.“
      Im Vergleich zu progressive loading fühlt es sich präziser an, alle Referenzen auf einmal zu laden.
    • Skills sind nützlich, um wiederkehrende Aufgaben wie Debugging, Commits und PR-Bearbeitung zu automatisieren.
      Besonders ein Debugging-Skill verhindert, dass die AI in Schleifen gerät.
  • Technisch gesehen ist ein Skill ein automatisiertes Prompt-Injection-System.
    Es ist eine vereinfachte Form dessen, was die meisten AI-Wrapper-Apps tun (Prompt Injection + RAG + MCP).

    • Tatsächlich lassen sich viele AI-Wrapper-Apps inzwischen durch einen Ordner und eine Markdown-Datei ersetzen.
  • Es wurde @simonw dafür gedankt, dass er Bildern immer Alt-Text hinzufügt.

  • Es wurde gefragt, ob es einen grundlegenden Unterschied zwischen Skill und Tool gibt. Ob man einen kurzen Skill bauen und wie ein Tool verwenden kann.

  • Wer Skills auch mit anderen Modellen (z. B. Gemini CLI) nutzen will, kann mein open-skills verwenden.
    Allerdings wird ein Mac benötigt, es läuft in einem lokalen Container und ist nicht von der Cloud abhängig.

  • Das Vorstellungsvideo zu Anthropics Skills-Designphilosophie wurde veröffentlicht.
    Siehe den YouTube-Link.

  • Die zunehmend komplexere Struktur ist verwirrend.
    Früher wurde der Kontext mit agents.md erweitert, jetzt muss man noch eine weitere md-Datei hinzufügen.

    • Ich weise Claude an: „Beurteile, welche Teile dieser Arbeit es wert sind, als Skill erstellt zu werden, und nutze den skill-making skill, um sie zu erstellen.“
    • MCP ist komplex, aber Skills wirken wie das einfachste Design, um bestehende Coding-Agents um Funktionen zu erweitern.