Advisor-Strategie: Mit Opus als Berater die Intelligenz von Sonnet steigern

(claude.com)

36 Punkte von GN⁺ 2026-04-10 | 1 Kommentare | Auf WhatsApp teilen

Die Advisor-Strategie wurde offiziell in der Claude Platform eingeführt — ein Muster, das Opus als Berater und Sonnet oder Haiku als Executor kombiniert, um die Kosten zu senken und Agenten eine Schlussfolgerungsfähigkeit nahe dem Opus-Niveau zu geben
Wenn Sonnet Aufgaben nicht allein, sondern in Kombination mit einem Opus-Berater ausführt, stieg der SWE-bench-Multilingual-Score um 2,7 Prozentpunkte; zugleich sanken die Kosten pro Agenten-Task um 11,9 %
Die Kombination Haiku + Opus-Berater erzielte bei BrowseComp 41,2 % und damit mehr als doppelt so viel wie Haiku allein (19,7 %), während die Kosten gegenüber Sonnet allein um 85 % sanken
Wenn das Tool advisor_20260301 in einer Messages-API-Anfrage deklariert wird, erfolgt die Modellübergabe innerhalb einer einzelnen /v1/messages-Anfrage — ohne zusätzliche Roundtrips oder Kontextverwaltung
Advisor-Tokens werden zum Tarif des Advisor-Modells, Executor-Tokens zum Tarif des Executor-Modells separat abgerechnet, wodurch sich Kosten nachverfolgen und kontrollieren lassen

Überblick über die Advisor-Strategie

Sonnet oder Haiku fungieren als Executor und führen die Aufgabe von Anfang bis Ende aus; sie übernehmen Tool-Aufrufe, das Lesen von Ergebnissen und iterative Arbeitsschritte
Wenn der Executor auf eine Entscheidung stößt, die sich nur schwer angemessen lösen lässt, fordert er Guidance von Opus an; Opus referenziert den gemeinsam genutzten Kontext und gibt eines von Planung, Korrektur oder Abbruchsignal zurück
Der Advisor (Opus) ruft keine Tools direkt auf und erzeugt keine nutzerseitigen Ausgaben, sondern liefert ausschließlich Guidance für den Executor
Diese Struktur kehrt das bestehende Subagenten-Muster um, bei dem ein großes Orchestrator-Modell Aufgaben zerlegt und an kleinere Worker-Modelle delegiert, und funktioniert ohne separaten Worker-Pool oder Orchestrierungslogik
Schlussfolgern auf Frontier-Niveau wird nur dann eingesetzt, wenn der Executor es benötigt; in allen übrigen Ausführungsphasen bleiben die Kosten auf dem Niveau des Executor-Modells

Ergebnisse der Leistungsevaluierung

Die Kombination Sonnet + Opus-Berater erzielte bei SWE-bench Multilingual einen Zuwachs von 2,7 Prozentpunkten gegenüber Sonnet allein, während die Kosten pro Agenten-Task um 11,9 % sanken
Auch in den Benchmarks BrowseComp und Terminal-Bench 2.0 stiegen die Scores gegenüber Sonnet allein, während die Kosten pro Task zurückgingen
Haiku + Opus-Berater: BrowseComp-Score 41,2 % — mehr als doppelt so hoch wie Haiku allein (19,7 %)
- Der Score liegt 29 % unter Sonnet allein, aber die Kosten pro Task sinken um 85 %
- Durch den zusätzlichen Advisor steigen die Kosten gegenüber Haiku allein, doch die kombinierten Kosten bleiben weiterhin deutlich unter Sonnet

Nutzung des Advisor-Tools

Wenn advisor_20260301 in einer Messages-API-Anfrage deklariert wird, ist die Modellübergabe innerhalb einer einzelnen /v1/messages-Anfrage abgeschlossen — zusätzliche Roundtrips oder Kontextverwaltung sind nicht nötig
Das Executor-Modell entscheidet selbst, wann es den Advisor aufruft; kuratierter Kontext wird an das Advisor-Modell übergeben und ein Plan zurückgegeben
Mit dem Parameter max_uses lässt sich die Obergrenze für Advisor-Aufrufe pro Anfrage festlegen
Advisor-Tokens werden im Usage-Block separat ausgewiesen, sodass sich Ausgaben nach Tiers nachverfolgen lassen
Kann im selben Loop wie bestehende Tools (Websuche, Codeausführung usw.) genutzt werden

response = client.messages.create(  
    model="claude-sonnet-4-6",  # executor  
    tools=[  
        {  
            "type": "advisor_20260301",  
            "name": "advisor",  
            "model": "claude-opus-4-6",  
            "max_uses": 3,  
        },  
        # ... your other tools  
    ],  
    messages=[...]  
)

Preisstruktur

Advisor-Tokens werden zum Tarif des Advisor-Modells (Opus) berechnet, Executor-Tokens zum Tarif des Executor-Modells (Sonnet/Haiku)
Der Advisor erzeugt nur kurze Pläne (typischerweise 400 bis 700 Text-Tokens), während die vollständige Ausgabe vom Executor zu niedrigeren Kosten verarbeitet wird; dadurch bleiben die Gesamtkosten deutlich niedriger als bei einer Ausführung allein mit dem Advisor-Modell

Nutzerfeedback

ML Engineer bei Eve Legal: "Haiku 4.5 skaliert seine Intelligenz dynamisch je nach Komplexität durch Rückgriff auf Opus 4.6 und erreicht Qualität auf Frontier-Modell-Niveau zu fünfmal niedrigeren Kosten"
CEO von Bolt: "Trifft bei komplexen Aufgaben bessere Architekturentscheidungen und verursacht bei einfachen Aufgaben keinen Overhead — der Unterschied bei Planungs- und Ausführungstrajektorien ist deutlich"
CTO von Genspark: "Klare Verbesserungen bei Agenten-Turns, Tool-Aufrufen und Gesamtscore — bessere Ergebnisse als unser selbst entwickeltes Planning-Tool"

Erste Schritte

Derzeit als Beta in der Claude Platform verfügbar
Vorgehen für den Start:
1. Beta-Feature-Header hinzufügen: anthropic-beta: advisor-tool-2026-03-01
2. advisor_20260301 zur Messages-API-Anfrage hinzufügen
3. System-Prompt passend zum Use Case anpassen
Es wird empfohlen, drei Konfigurationen mit der bestehenden Eval-Suite zu vergleichen: Sonnet allein / Sonnet + Opus-Berater / Opus allein

1 Kommentare

heycalmdown 2026-04-10

Es ist zum jetzigen Zeitpunkt keine besonders originelle Idee, aber ich finde es eine gute Methode, weil sie sich umsetzen lässt, ohne die Interface-Signaturen oder den Workflow zu verändern.