- Die Advisor-Strategie wurde offiziell in der Claude Platform eingeführt — ein Muster, das Opus als Berater und Sonnet oder Haiku als Executor kombiniert, um die Kosten zu senken und Agenten eine Schlussfolgerungsfähigkeit nahe dem Opus-Niveau zu geben
- Wenn Sonnet Aufgaben nicht allein, sondern in Kombination mit einem Opus-Berater ausführt, stieg der SWE-bench-Multilingual-Score um 2,7 Prozentpunkte; zugleich sanken die Kosten pro Agenten-Task um 11,9 %
- Die Kombination Haiku + Opus-Berater erzielte bei BrowseComp 41,2 % und damit mehr als doppelt so viel wie Haiku allein (19,7 %), während die Kosten gegenüber Sonnet allein um 85 % sanken
- Wenn das Tool advisor_20260301 in einer Messages-API-Anfrage deklariert wird, erfolgt die Modellübergabe innerhalb einer einzelnen
/v1/messages-Anfrage — ohne zusätzliche Roundtrips oder Kontextverwaltung
- Advisor-Tokens werden zum Tarif des Advisor-Modells, Executor-Tokens zum Tarif des Executor-Modells separat abgerechnet, wodurch sich Kosten nachverfolgen und kontrollieren lassen
Überblick über die Advisor-Strategie
- Sonnet oder Haiku fungieren als Executor und führen die Aufgabe von Anfang bis Ende aus; sie übernehmen Tool-Aufrufe, das Lesen von Ergebnissen und iterative Arbeitsschritte
- Wenn der Executor auf eine Entscheidung stößt, die sich nur schwer angemessen lösen lässt, fordert er Guidance von Opus an; Opus referenziert den gemeinsam genutzten Kontext und gibt eines von Planung, Korrektur oder Abbruchsignal zurück
- Der Advisor (Opus) ruft keine Tools direkt auf und erzeugt keine nutzerseitigen Ausgaben, sondern liefert ausschließlich Guidance für den Executor
- Diese Struktur kehrt das bestehende Subagenten-Muster um, bei dem ein großes Orchestrator-Modell Aufgaben zerlegt und an kleinere Worker-Modelle delegiert, und funktioniert ohne separaten Worker-Pool oder Orchestrierungslogik
- Schlussfolgern auf Frontier-Niveau wird nur dann eingesetzt, wenn der Executor es benötigt; in allen übrigen Ausführungsphasen bleiben die Kosten auf dem Niveau des Executor-Modells
Ergebnisse der Leistungsevaluierung
- Die Kombination Sonnet + Opus-Berater erzielte bei SWE-bench Multilingual einen Zuwachs von 2,7 Prozentpunkten gegenüber Sonnet allein, während die Kosten pro Agenten-Task um 11,9 % sanken
- Auch in den Benchmarks BrowseComp und Terminal-Bench 2.0 stiegen die Scores gegenüber Sonnet allein, während die Kosten pro Task zurückgingen
- Haiku + Opus-Berater: BrowseComp-Score 41,2 % — mehr als doppelt so hoch wie Haiku allein (19,7 %)
- Der Score liegt 29 % unter Sonnet allein, aber die Kosten pro Task sinken um 85 %
- Durch den zusätzlichen Advisor steigen die Kosten gegenüber Haiku allein, doch die kombinierten Kosten bleiben weiterhin deutlich unter Sonnet
Nutzung des Advisor-Tools
- Wenn advisor_20260301 in einer Messages-API-Anfrage deklariert wird, ist die Modellübergabe innerhalb einer einzelnen
/v1/messages-Anfrage abgeschlossen — zusätzliche Roundtrips oder Kontextverwaltung sind nicht nötig
- Das Executor-Modell entscheidet selbst, wann es den Advisor aufruft; kuratierter Kontext wird an das Advisor-Modell übergeben und ein Plan zurückgegeben
- Mit dem Parameter max_uses lässt sich die Obergrenze für Advisor-Aufrufe pro Anfrage festlegen
- Advisor-Tokens werden im Usage-Block separat ausgewiesen, sodass sich Ausgaben nach Tiers nachverfolgen lassen
- Kann im selben Loop wie bestehende Tools (Websuche, Codeausführung usw.) genutzt werden
response = client.messages.create(
model="claude-sonnet-4-6", # executor
tools=[
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
"max_uses": 3,
},
# ... your other tools
],
messages=[...]
)
Preisstruktur
- Advisor-Tokens werden zum Tarif des Advisor-Modells (Opus) berechnet, Executor-Tokens zum Tarif des Executor-Modells (Sonnet/Haiku)
- Der Advisor erzeugt nur kurze Pläne (typischerweise 400 bis 700 Text-Tokens), während die vollständige Ausgabe vom Executor zu niedrigeren Kosten verarbeitet wird; dadurch bleiben die Gesamtkosten deutlich niedriger als bei einer Ausführung allein mit dem Advisor-Modell
Nutzerfeedback
- ML Engineer bei Eve Legal: "Haiku 4.5 skaliert seine Intelligenz dynamisch je nach Komplexität durch Rückgriff auf Opus 4.6 und erreicht Qualität auf Frontier-Modell-Niveau zu fünfmal niedrigeren Kosten"
- CEO von Bolt: "Trifft bei komplexen Aufgaben bessere Architekturentscheidungen und verursacht bei einfachen Aufgaben keinen Overhead — der Unterschied bei Planungs- und Ausführungstrajektorien ist deutlich"
- CTO von Genspark: "Klare Verbesserungen bei Agenten-Turns, Tool-Aufrufen und Gesamtscore — bessere Ergebnisse als unser selbst entwickeltes Planning-Tool"
Erste Schritte
- Derzeit als Beta in der Claude Platform verfügbar
- Vorgehen für den Start:
- Beta-Feature-Header hinzufügen:
anthropic-beta: advisor-tool-2026-03-01
advisor_20260301 zur Messages-API-Anfrage hinzufügen
- System-Prompt passend zum Use Case anpassen
- Es wird empfohlen, drei Konfigurationen mit der bestehenden Eval-Suite zu vergleichen: Sonnet allein / Sonnet + Opus-Berater / Opus allein
1 Kommentare
Es ist zum jetzigen Zeitpunkt keine besonders originelle Idee, aber ich finde es eine gute Methode, weil sie sich umsetzen lässt, ohne die Interface-Signaturen oder den Workflow zu verändern.