Google stellt Open Knowledge Format vor – ein Standard zum Wissensaustausch für AI-Agenten
(cloud.google.com)- Eine anbieterneutrale offene Spezifikation, mit der mehrere Agenten von verschiedenen Produzenten erstellte Wikis ohne Übersetzung nutzen können; sie formalisiert das LLM-Wiki-Muster in ein portables und interoperables Format
- OKF v0.1 stellt Wissen als ein Verzeichnis von Markdown-Dateien mit YAML-Frontmatter dar und funktioniert ohne komplexe Komprimierungsverfahren, neue Laufzeiten oder obligatorische SDKs
- Wissen innerhalb von Organisationen ist über fragmentierte Systeme verteilt – etwa Metadatenkataloge, Wikis, Code-Kommentare oder die Köpfe einiger Senior Engineers – sodass Agenten das gleiche Problem der Kontextzusammenstellung jedes Mal von Grund auf neu lösen müssen
- Die Antwort ist kein neuer Wissensservice, sondern das Format selbst: Jeder kann es ohne SDK erzeugen und ohne Integration konsumieren, und es lässt sich zusammen mit Code in der Versionsverwaltung verwalten
- Als offener Standard veröffentlicht, wird sein Wert durch die Erweiterung des Produzenten- und Konsumenten-Ökosystems bestimmt
Hintergrund: eine fragmentierte Kontextlandschaft
- Auch wenn sich Foundation-Modelle verbessern, ist ihre Leistung – besonders beim Aufbau von Agentensystemen – durch fehlenden relevanten Kontext begrenzt
- Code schreiben, Dokumente zusammenfassen und Datensätze analysieren können sie, doch für präzise und ausführbare Ergebnisse brauchen sie die richtigen Informationen
- Die Informationen, die Modelle in Organisationen nutzen, sind überwiegend internes Wissen, etwa Tabellenschemata, die Bedeutung geschäftlicher Kennzahlen, Incident-Runbooks, Join-Pfade zwischen zwei Systemen oder Abkündigungen alter APIs
- Beispiele für Systeme, in denen diese Wissenseinheiten verstreut sind
- Metadatenkataloge mit eigener API
- Wikis, Drittanbietersysteme, geteilte Laufwerke
- Code-Kommentare, Docstrings, Notebook-Zellen
- die Köpfe einiger Senior Engineers
- Um eine Frage wie „Wie berechnet man Weekly Active Users (WAU) aus einem Event-Stream?“ zu beantworten, muss ein Agent die Antwort aus nicht kompatiblen Oberflächen zusammensetzen
- Jeder Anbieter stellt seinen eigenen Katalog, sein eigenes SDK und sein eigenes Wissensgraph-Schema bereit, wodurch Wissen nicht zwischen Produkten und Organisationen portierbar ist
- Das Ergebnis: Jeder Agent-Builder wiederholt dasselbe Problem der Kontextzusammenstellung, Kataloganbieter erfinden dieselben Datenmodelle neu, und Wissen bleibt in der Oberfläche eingeschlossen, in der es erzeugt wurde
Wissen als lebendiges Wiki
- Entwicklungsteams wechseln von wiederholten Suchen nach denselben Fakten in denselben Dokumenten dazu, Agenten eine gemeinsame Markdown-Bibliothek bereitzustellen, die mit der Zeit nützlicher wird
- Agenten übernehmen die Routinearbeit des Lesens und Aktualisierens ihrer eigenen Dateien, während Teams Inhalte kuratieren und wie Code verwalten
- Andrej Karpathy stellte diese Idee in seinem LLM Wiki gist vor
- Er schrieb, dass „LLMs sich nicht langweilen, nicht vergessen, Querverweise zu aktualisieren, und 15 Dateien auf einmal verarbeiten können“
- Genau die Buchführungsarbeit (bookkeeping), die Menschen persönliche Wikis aufgeben lässt, ist etwas, worin LLMs gut sind
- Dasselbe Wissens-Wiki-Muster taucht unter verschiedenen Namen immer wieder auf
- ein mit Coding-Agenten verbundenes Obsidian vault
- Konventionsdateien der Art AGENTS.md / CLAUDE.md
- Artefaktspeicher wie index.md und log.md, auf die Agenten vor der Arbeit zugreifen
- interne „metadata as code“-Repos von Datenteams
- Das Muster ist mächtig, hat aber die Grenze, dass jeder Fall maßgeschneidert (bespoke) ist
- Markdown, Frontmatter und Querverlinkungen sehen ähnlich aus, sind aber nicht für Zusammenarbeit entworfen
- Es gibt keine Einigung darüber, welche Felder oder Dateinamen alle Dokumente haben sollten; dadurch bleibt Wissen im ursprünglichen Team siloisiert, und beim Bau neuer Agenten entsteht Doppelarbeit
Benötigt wird kein Service, sondern ein Format
- Die Antwort ist nicht noch ein Wissensservice, sondern ein Format zur Darstellung von Wissen, das folgende Anforderungen erfüllen muss
- Jeder muss es ohne SDK erzeugen können
- Jeder muss es ohne Integration konsumieren können
- Es muss beim Wechsel zwischen Systemen, Organisationen und Tools erhalten bleiben
- Es muss zusammen mit dem beschriebenen Code in der Versionsverwaltung existieren
- Es muss für Menschen lesbar und für Agenten parsbar sein, wobei dieselben Dateien ohne Übersetzungsschicht genutzt werden
- OKF ist ein Format, das diese Anforderungen von Anfang an erfüllt
So funktioniert OKF: das Design auf einen Blick
- Ein OKF-Bundle ist ein Verzeichnis von Markdown-Dateien, das Konzepte repräsentiert, also alles, was erfasst werden soll – Tabellen, Datensätze, Kennzahlen, Playbooks, Runbooks, APIs usw.
- Jedes Konzept ist eine einzelne Datei, und der Dateipfad ist die Identität des Konzepts
- Beispiel für die Verzeichnisstruktur: Unter
salesliegen die Ordnerdatasets,tables,metricssowie Dateien wieorders.md,customers.md,weekly_active_users.md
- Jedes Konzeptdokument besteht aus einem YAML-Frontmatter-Block für strukturierte Felder und einem Markdown-Hauptteil für den Rest
- Beispiele für Frontmatter-Felder:
type(BigQuery Table),title(Orders),description,resource(Konsolen-URL),tags([sales, revenue]),timestamp(2026-05-28T14:30:00Z) - Im Hauptteil können etwa Schema-Angaben (
order_id,customer_idmit Typen und Beschreibungen) sowie Joins (Join aufcustomersübercustomer_id) stehen
- Beispiele für Frontmatter-Felder:
- Konzepte sind über normale Markdown-Links miteinander verbunden und verwandeln das Verzeichnis in einen Graphen, der reichhaltiger ist als reine Eltern/Kind-Beziehungen im Dateisystem
- Ein Bundle kann optional die Dateien
index.md(für progressive Offenlegung bei der Agenten-Navigation) undlog.md(Änderungsverlauf) enthalten
- Ein Bundle kann optional die Dateien
- Die vollständige Spezifikation von v0.1 passt auf eine Seite und umfasst Konformitätskriterien, Regeln für Querverlinkungen und einige reservierte Dateinamen
Drei Prinzipien des Designs
-
Minimally opinionated
- Das Einzige, was OKF für alle Konzepte verlangt, ist das Feld
type - Welche
type-Werte es gibt, welche zusätzlichen Felder verwendet werden und welche Abschnitte im Hauptteil stehen, bleibt den Produzenten überlassen - Die Spezifikation definiert nur die Interoperabilitätsoberfläche, nicht das Inhaltsmodell
- Das Einzige, was OKF für alle Konzepte verlangt, ist das Feld
-
Producer/consumer independence
- Die Instanz, die Wissen schreibt, und die Instanz, die es konsumiert, werden sauber voneinander getrennt
- Von Menschen manuell geschriebene Bundles können von AI-Agenten konsumiert werden, von Metadaten-Exportpipelines erzeugte Bundles in einem Visualisierer durchsucht werden, und ein von einem LLM synthetisiertes Bundle kann von einem anderen LLM abgefragt werden
- Das Format ist der Vertrag; Tools an beiden Enden lassen sich unabhängig austauschen
-
Format, not platform
- Es ist nicht an eine bestimmte Cloud, Datenbank, einen Modellanbieter oder ein Agent-Framework gebunden
- Für Lesen, Schreiben und Serving sind weder proprietäre Accounts noch SDKs erforderlich
- Der Wert eines Wissensformats entsteht nicht aus Besitz, sondern daraus, wie viele Akteure es verwenden; deshalb wird es als offener Standard veröffentlicht
Was zusammen mit der Spezifikation geliefert wird
- Um das Format greifbar zu machen, wurden Referenzimplementierungen sowohl für Produzenten als auch für Konsumenten veröffentlicht
- Enrichment agent: Durchläuft BigQuery-Datensätze, erstellt Entwürfe von OKF-Konzeptdokumenten für alle Tabellen und Views und reichert anschließend in einem zweiten LLM-Durchlauf jedes Konzept mit Zitaten, Schemata und Join-Pfaden an, indem offizielle Dokumentation gecrawlt wird
- Statischer HTML-Visualisierer: Wandelt ein beliebiges OKF-Bundle in eine interaktive Graph-Ansicht als eigenständige Ein-Datei-Ausgabe um; kein Backend nötig, keine Installation auf Seiten des Betrachters, und die Daten verlassen die Seite nicht
- Drei sofort erkundbare Beispiel-Bundles: für GA4 E-Commerce, Stack Overflow und den öffentlichen Bitcoin-Datensatz; vom Referenzagenten erzeugt und als lebendige, passende Beispiele für OKF ins Repository eingecheckt
- Diese sind bewusst Proofs of Concept
- Der Agent zeigt nur eine Möglichkeit der OKF-Erzeugung und setzt weder ein bestimmtes Framework noch ein bestimmtes LLM voraus
- Der Visualisierer zeigt nur eine Möglichkeit des Konsums und setzt weder HTML noch eine Graph-Ansicht voraus
- Erwartet wird, dass das Produzenten- und Konsumenten-Ökosystem weit über das Gelieferte hinaus wächst
Ausblick
- OKF v0.1 ist kein fertiger Standard, sondern ein Ausgangspunkt, der sich weiterentwickelt, wenn mehr Produzenten und Konsumenten entstehen und man lernt, welche Wissensrepräsentationen Agenten tatsächlich brauchen
- Ob Wissenskatalog, Enrichment-Pipeline oder Wiki für AI-Agenten – was auch immer gebaut wird, es sollte vom ersten Tag an offen veröffentlicht werden, damit das Format seinem Namen gerecht wird
- Empfohlene Schritte
- Die Spezifikation lesen (kurz)
- Produzenten (producer) für Quellsysteme, Datenbanken und Dokumentationsseiten schreiben
- Konsumenten (consumer) wie Viewer, Suchindizes oder Agenten schreiben, die auf Bundles schlussfolgern
- Die Referenzimplementierungen auf eigene Daten anwenden
- Issues eröffnen, PRs senden, Erweiterungen vorschlagen (die Spezifikation ist versioniert und auf rückwärtskompatibles Wachstum ausgelegt)
- Repository, Spezifikation und Beispiel-Bundles sind auf GitHub öffentlich verfügbar, und Google Clouds Knowledge Catalog wurde so aktualisiert, dass er OKF aufnimmt und an Agenten ausliefert
- Der eigentliche Beitrag ist das Format; die bereitgestellten Tools dienen dazu, das Format in die Praxis zu bringen und die Einstiegskosten zu senken; OKF ist als lingua franca für künftigen Wissensaustausch konzipiert
2 Kommentare
So etwas wie die beste Option für diejenigen, die weder
.claudenoch.agentnutzen konnten, oder?Hacker-News-Kommentare
Mir gefällt die Einfachheit dieser OKF-Spezifikation, aber ich bin nicht sicher, ob sich wirklich alles gut als „einfach nur Markdown“ ausdrücken lässt
In letzter Zeit interessiert mich, wie man Konzepte so ausdrücken kann, dass AI effektiv und tokeneffizient gemeinsam daran mitwirken kann, und meist geht es darum, einen Weg zu finden, etwas gut in halbstrukturiertem sequentiellem Text auszudrücken. Dabei darf man aber nicht die Erfahrung opfern, Wissen für Menschen lesbar darzustellen
Gerade wenn auch Rollen beitragen sollen, die traditionell keine Entwickler sind, dürfte sich „seltsames Textformat + git“ deutlich schlechter anfühlen als die heutigen Autoren- und Visualisierungstools
Ich bin gespannt, wie in den nächsten Jahren Standards entstehen werden, um verschiedene Arten von Wissen semantisch auszudrücken
Als erfolgreiche Beispiele, an denen man sich orientieren kann, gibt es DBML für Schema/E-R, LikeC4 für Architektur und diagram-as-code-Ansätze wie Mermaid. LLMs verstehen solche Formate in der Regel auch gut, und man kann sie ihnen sogar mit einem kurzen EBNF-Prompt beibringen. Wichtig ist, dass sie auch gut lesbare Visualisierungen für Menschen haben, sich in Markdown als
code blockdirekt neben natürlicher Sprache einfügen lassen und LLMs beim Schreiben der Syntax helfen könnenSchwieriger sind Dinge wie komplexe Tabellen oder Miro, bei denen räumliche Anordnung und Farben implizite Bedeutung tragen. Dafür habe ich noch keine gute Alternative gefunden
Ein eigener Versuch im Bereich Data Engineering ist https://equalexperts.github.io/satsuma-lang/, damit AI und Menschen gemeinsam Source-Target-Mappings und Transformationen bearbeiten können. Es ist eine kompakte strukturierte Textdarstellung, die natürliche Sprache erlaubt, und bietet zugleich gute Visualisierungen sowie LSP-/Syntax-Tools, damit Agenten nicht große Dokumente tokenineffizient zerschneiden müssen, um über Lineage, Vollständigkeit oder undefinierte Quellen nachzudenken
Ein Markdown-Dokument kann durch Hinzufügen von
typeim vorderen YAML zu einem OKF-Dokument werdenWie wäre es mit einer Knowledge-Graph-Sprache, die auch in Markdown-Prosa oder in Markdown-Codeblöcken nutzbar ist und überall dort eingesetzt werden kann, wo es Textfelder gibt?
In der minimalistischen Sprache https://ddot.it lassen sich auch Dateien außerhalb der Markdown-Welt, URLs und einfache Labels verknüpfen. Genau wie OKF ist es einfach nur ein einziges Format
Der Vollständigkeit halber: Diese kurze Spezifikation habe ich geschrieben
Ich stimme zu, dass sich damit nicht alles gut ausdrücken lässt, aber das geht am Kern vorbei. Markdown gewinnt offenbar, weil es der kleinste gemeinsame Nenner für Menschen und AI-Modelle ist
Es macht Spaß, sich alle zehn Jahre wieder RDF/OWL-Semantic-Web-Formate anzusehen
Irgendwann wird eines dieser Jahre das echte Jahr sein
https://en.wikipedia.org/wiki/Semantic_Web
Im Originaltext gibt es mehrere kaputte Links, daher lasse ich das Repository hier
https://github.com/GoogleCloudPlatform/knowledge-catalog
Spezifikation: https://github.com/GoogleCloudPlatform/knowledge-catalog/blo...
So wie ich es verstehe, ist das im Wesentlichen eher ein Sprungbrett für Menschen, weil wir über drei Dimensionen hinaus nicht sehen können
Wenn wir die Dinge halbwegs gut organisieren, hoffe ich, dass Agenten das Markdown nehmen und entweder eine Graph-Infrastruktur im Speicher aufbauen oder es in Neo4j speichern können
Ist eine Variante von Markdown festgelegt, zum Beispiel CommonMark?
Beim schnellen Überfliegen der ersten paar Seiten habe ich dazu nichts gesehen, aber für eine Spezifikation wirkt das ziemlich wichtig
Was Google veröffentlicht hat, ist letztlich Markdown mit YAML-Frontmatter. Bitte Applaus. Dafür eine 15-KB-Spezifikation
Ich wäre weniger sarkastisch, wenn alle aufhören würden, YAML zu benutzen nach dem Motto „ups, eine Einrückung vergessen“
Als jemand, der viele PDFs gesehen hat, die nach Markdown „übersetzt“ werden mussten, wirkt das wie eine seltsame Wahl
Ich verstehe, dass das Hauptziel wohl ein leichterer Zugriff für AI ist, aber wenn man Modelle sowieso trainieren will, frage ich mich, warum man sie nicht gleich mit einem besseren Format trainiert
Markdown ist ziemlich eingeschränkt und kann zum Beispiel verschachtelte Tabellen nicht rendern. Wenn der Zweck von „offenem Wissen“ AI ist, weiß ich auch nicht, ob man überhaupt ein Format verwenden sollte, das Menschen tatsächlich lesen sollen
Mir gefällt der Ansatz. Ich mag hierarchische Wissensorganisation sehr
Ich halte Claudes aktuelle Wissensmanagement-Abstraktion derzeit für fast vollständig kaputt. Das zeigt sich, wenn man mehrere Coder gleichzeitig laufen lässt oder mehr als 1.000 Skills anlegen muss. Beispiel: https://news.ycombinator.com/item?id=48407998
Es lohnt sich, barrasindustries.com/okfind/ anzusehen
Das ist eine Idee für ein OKF-Bundle-Register