36 Punkte von GN⁺ 20 일 전 | 1 Kommentare | Auf WhatsApp teilen
  • Die Advisor-Strategie wurde offiziell in der Claude Platform eingeführt — ein Muster, das Opus als Berater und Sonnet oder Haiku als Executor kombiniert, um die Kosten zu senken und Agenten eine Schlussfolgerungsfähigkeit nahe dem Opus-Niveau zu geben
  • Wenn Sonnet Aufgaben nicht allein, sondern in Kombination mit einem Opus-Berater ausführt, stieg der SWE-bench-Multilingual-Score um 2,7 Prozentpunkte; zugleich sanken die Kosten pro Agenten-Task um 11,9 %
  • Die Kombination Haiku + Opus-Berater erzielte bei BrowseComp 41,2 % und damit mehr als doppelt so viel wie Haiku allein (19,7 %), während die Kosten gegenüber Sonnet allein um 85 % sanken
  • Wenn das Tool advisor_20260301 in einer Messages-API-Anfrage deklariert wird, erfolgt die Modellübergabe innerhalb einer einzelnen /v1/messages-Anfrage — ohne zusätzliche Roundtrips oder Kontextverwaltung
  • Advisor-Tokens werden zum Tarif des Advisor-Modells, Executor-Tokens zum Tarif des Executor-Modells separat abgerechnet, wodurch sich Kosten nachverfolgen und kontrollieren lassen

Überblick über die Advisor-Strategie

  • Sonnet oder Haiku fungieren als Executor und führen die Aufgabe von Anfang bis Ende aus; sie übernehmen Tool-Aufrufe, das Lesen von Ergebnissen und iterative Arbeitsschritte
  • Wenn der Executor auf eine Entscheidung stößt, die sich nur schwer angemessen lösen lässt, fordert er Guidance von Opus an; Opus referenziert den gemeinsam genutzten Kontext und gibt eines von Planung, Korrektur oder Abbruchsignal zurück
  • Der Advisor (Opus) ruft keine Tools direkt auf und erzeugt keine nutzerseitigen Ausgaben, sondern liefert ausschließlich Guidance für den Executor
  • Diese Struktur kehrt das bestehende Subagenten-Muster um, bei dem ein großes Orchestrator-Modell Aufgaben zerlegt und an kleinere Worker-Modelle delegiert, und funktioniert ohne separaten Worker-Pool oder Orchestrierungslogik
  • Schlussfolgern auf Frontier-Niveau wird nur dann eingesetzt, wenn der Executor es benötigt; in allen übrigen Ausführungsphasen bleiben die Kosten auf dem Niveau des Executor-Modells

Ergebnisse der Leistungsevaluierung

  • Die Kombination Sonnet + Opus-Berater erzielte bei SWE-bench Multilingual einen Zuwachs von 2,7 Prozentpunkten gegenüber Sonnet allein, während die Kosten pro Agenten-Task um 11,9 % sanken
  • Auch in den Benchmarks BrowseComp und Terminal-Bench 2.0 stiegen die Scores gegenüber Sonnet allein, während die Kosten pro Task zurückgingen
  • Haiku + Opus-Berater: BrowseComp-Score 41,2 % — mehr als doppelt so hoch wie Haiku allein (19,7 %)
    • Der Score liegt 29 % unter Sonnet allein, aber die Kosten pro Task sinken um 85 %
    • Durch den zusätzlichen Advisor steigen die Kosten gegenüber Haiku allein, doch die kombinierten Kosten bleiben weiterhin deutlich unter Sonnet

Nutzung des Advisor-Tools

  • Wenn advisor_20260301 in einer Messages-API-Anfrage deklariert wird, ist die Modellübergabe innerhalb einer einzelnen /v1/messages-Anfrage abgeschlossen — zusätzliche Roundtrips oder Kontextverwaltung sind nicht nötig
  • Das Executor-Modell entscheidet selbst, wann es den Advisor aufruft; kuratierter Kontext wird an das Advisor-Modell übergeben und ein Plan zurückgegeben
  • Mit dem Parameter max_uses lässt sich die Obergrenze für Advisor-Aufrufe pro Anfrage festlegen
  • Advisor-Tokens werden im Usage-Block separat ausgewiesen, sodass sich Ausgaben nach Tiers nachverfolgen lassen
  • Kann im selben Loop wie bestehende Tools (Websuche, Codeausführung usw.) genutzt werden
response = client.messages.create(  
    model="claude-sonnet-4-6",  # executor  
    tools=[  
        {  
            "type": "advisor_20260301",  
            "name": "advisor",  
            "model": "claude-opus-4-6",  
            "max_uses": 3,  
        },  
        # ... your other tools  
    ],  
    messages=[...]  
)  

Preisstruktur

  • Advisor-Tokens werden zum Tarif des Advisor-Modells (Opus) berechnet, Executor-Tokens zum Tarif des Executor-Modells (Sonnet/Haiku)
  • Der Advisor erzeugt nur kurze Pläne (typischerweise 400 bis 700 Text-Tokens), während die vollständige Ausgabe vom Executor zu niedrigeren Kosten verarbeitet wird; dadurch bleiben die Gesamtkosten deutlich niedriger als bei einer Ausführung allein mit dem Advisor-Modell

Nutzerfeedback

  • ML Engineer bei Eve Legal: "Haiku 4.5 skaliert seine Intelligenz dynamisch je nach Komplexität durch Rückgriff auf Opus 4.6 und erreicht Qualität auf Frontier-Modell-Niveau zu fünfmal niedrigeren Kosten"
  • CEO von Bolt: "Trifft bei komplexen Aufgaben bessere Architekturentscheidungen und verursacht bei einfachen Aufgaben keinen Overhead — der Unterschied bei Planungs- und Ausführungstrajektorien ist deutlich"
  • CTO von Genspark: "Klare Verbesserungen bei Agenten-Turns, Tool-Aufrufen und Gesamtscore — bessere Ergebnisse als unser selbst entwickeltes Planning-Tool"

Erste Schritte

  • Derzeit als Beta in der Claude Platform verfügbar
  • Vorgehen für den Start:
    1. Beta-Feature-Header hinzufügen: anthropic-beta: advisor-tool-2026-03-01
    2. advisor_20260301 zur Messages-API-Anfrage hinzufügen
    3. System-Prompt passend zum Use Case anpassen
  • Es wird empfohlen, drei Konfigurationen mit der bestehenden Eval-Suite zu vergleichen: Sonnet allein / Sonnet + Opus-Berater / Opus allein

1 Kommentare

 
heycalmdown 20 일 전

Es ist zum jetzigen Zeitpunkt keine besonders originelle Idee, aber ich finde es eine gute Methode, weil sie sich umsetzen lässt, ohne die Interface-Signaturen oder den Workflow zu verändern.