5 Punkte von GN⁺ 2025-03-06 | 1 Kommentare | Auf WhatsApp teilen
  • Eine offene Spezifikation auf Basis des OpenAPI-Standards, die einen klaren Vertrag zwischen LLMs und APIs definiert
    • API-Aufrufe werden als zielorientierte Tools strukturiert, damit LLMs sie leicht nutzen können
  • Mit bestehenden OpenAPI-Dokumentationen allein war es für LLMs schwierig, die passende API auszuwählen und aufzurufen
    • agents.json unterstützt dabei, dass der API-Aufrufprozess deterministisch bleibt, während die von LLMs angestrebten Ergebnisse nichtdeterministisch umgesetzt werden können

Warum wird es benötigt?

  • Um LLMs zu nutzen, muss die Art der Anbindung an APIs häufig direkt selbst implementiert werden
  • Viele Entwickler verzichten auf das nichtdeterministische Verhalten von Agenten und versuchen stattdessen, mit hart codierten Workflows das gewünschte Ergebnis zu erzielen
  • Mit agents.json kann ein LLM auf dem Weg zum gewünschten Ergebnis nichtdeterministisch arbeiten, während die API-Aufrufe selbst deterministisch ausgeführt werden
  • Bestehende APIs sind meist für Entwickler konzipiert und daher für die direkte Nutzung durch LLMs schwer geeignet
  • Beispiel Gmail API:
    • Erforderlich sind Schritte wie E-Mails suchen, die E-Mail-Liste eines Threads abrufen und auf eine bestimmte E-Mail antworten
    • Wenn ein LLM die OpenAPI-Dokumentation unverändert heranzieht, scheitert es oft daran, die passenden API-Aufrufe auszuwählen
    • Mit agents.json lassen sich API-Aufrufe vorab definieren und in der richtigen Reihenfolge ausführen

Bestandteile von agents.json

  • Die Datei agents.json
    • Dient dazu, API-Aufrufe miteinander zu verknüpfen und ergebnisorientierte Tools zu definieren
    • Wird zusammen mit bestehenden OpenAPI-Dateien verwendet
  • Das agents.json SDK
    • Ermöglicht es LLMs, auf Basis von agents.json Tools zu laden und eine Reihe von API-Aufrufen auszuführen

Unterschiede zu bestehendem OpenAPI

  • Bei alleiniger Nutzung von OpenAPI gelingt es LLMs häufig nicht, API-Aufrufe korrekt auszuwählen
  • Mit agents.json kann der Ablauf von API-Aufrufen als Template strukturiert werden, um den optimalen API-Flow für das gewünschte Ergebnis bereitzustellen

Warum es als Open Source veröffentlicht wurde

  • Anfangs war es eine intern genutzte Konfigurationsdatei, wurde aber mit wachsendem Funktionsumfang schließlich als Open Source veröffentlicht
  • HubSpot-CTO Dharmesh schlug das Konzept einer API-Übersetzungsspezifikation für LLMs vor; davon inspiriert wurde es öffentlich gemacht
  • Derzeit gibt es 10 verifizierte API-Integrationen, und täglich kommen neue APIs hinzu
  • Um Entwicklern eine einfache Erweiterung zu ermöglichen, wird kostenlos eine Plattform für Tool-Suche und benutzerdefinierte Sammlungen angeboten (https://wild-card.ai)

1 Kommentare

 
GN⁺ 2025-03-06
Hacker-News-Kommentare
  • Ich beobachte agents.json aufmerksam und hoffe, dass sich dieses Protokoll durchsetzt

    • Ich denke, dass MCP und agents.json nebeneinander bestehen könnten
    • MCP deckt mehr ab, und es könnte schwierig sein, daraus ein vereinfachtes Protokoll zu machen
  • Damit agents.json früh angenommen wird, müsste die Dokumentation leichter verständlich sein

    • Beispiele sollten sofort sichtbar sein, und das Schema sollte in unmittelbarer Nähe stehen
    • Der Pitch sollte prägnant sein, und auch die Felder des Schemas sollten klar sein
    • Es könnte ein Tool nötig sein, das durch Einfügen eines OpenAPI-Schemas einen Entwurf von agents.json erzeugt
  • Die Kompatibilität zwischen OpenAPI und agents.json ist gut, könnte aber übertrieben sein

    • OpenAPI ist beliebt, hat den Markt aber nicht vollständig erobert
    • Wenn dadurch zusätzliche Komplexität in agents.json entsteht, ist fraglich, ob sich die Unterstützung lohnt
    • Auch ohne 100%ige Kompatibilität könnte über benutzerdefinierte Konverter eine teilweise Unterstützung möglich sein
  • Viele Leute verwenden agentische IDEs, und es wäre gut, wenn agents.json Snippets bereitstellen würde, die erklären, wie man es verwendet, wie man Dokumentation findet und wie man das Register durchsucht

  • Frage nach den Unterschieden zwischen agents.json und der OpenAPI-Arazzo-Spezifikation

    • Zweifel, ob es besser für die Nutzung mit LLMs geeignet ist
    • In den Beispielen sind ähnliche Konzepte zu sehen
  • Die Meinung, dass es schwierig ist, echte agents.json-Dateien zu finden

    • Selbst nach 10 Minuten Suche im Register konnte kein Beispiel gefunden werden
  • Frage zur Lizenz des Python-Pakets

    • Unklar, ob es AGPL ist
  • Gute Idee, aber wegen der Lizenzprobleme könnte die Einführung schwierig sein

    • Man hofft, dass das Team erklärt, wie AGPL-Pakete in einem Produkt übernommen werden können
  • Es könnte noch einfacher werden, und das wäre gut

    • Möglicherweise wurde ein Bug im Titel der Informations-Eigenschaft der Spezifikation gefunden
  • Vergleich von agents.json und llms.txt

    • llms.txt entwickelt sich ebenfalls zu einem Standard, der LLMs hilft, APIs zu verstehen
    • agents.json scheint ein besseres strukturelles Verständnis verschiedener Endpunkte zu bieten
  • Frage, warum Agents keine APIs verwenden können, die mit einer OpenAPI-Spezifikation dokumentiert sind

    • In persönlichen Tests hat es gut funktioniert, daher muss etwas übersehen worden sein
  • Hoffnung, dass agents.json und LLM.txt zu einem einfachen Standard wie robot.txt werden

    • CrewAI, Letta/MemGPT, OpenHands/OpenDevin usw. sind zwar damit verbunden, überschreiten aber keine Grenzen
    • MCP ist der flexibelste Ansatz, und hoffentlich passt agents.json gut dazu
    • Das Netlify-Team denkt über etwas Interessantes rund um Agent Experience (AX) nach, und die Teams von Anthropic und wildcard sollten darauf achten
  • Frage nach den Gemeinsamkeiten/Unterschieden zu MCP

    • Sieht cool aus