Anthropic veröffentlicht Claude Opus 4.7 – Selbstverifikation, 3,3-fach höher auflösende Vision, 13 % besseres Coding
(anthropic.com)Anthropic hat sein Flaggschiffmodell Claude Opus 4.7 veröffentlicht.
- Auf SWE-bench Verified 87,6 % (+6,8 Prozentpunkte) und auf SWE-bench Pro 64,3 % und damit vor GPT-5.4 (57,7 %) auf Platz 1
- Erreicht 94,2 % bei GPQA Diamond, 69,4 % bei Terminal-Bench 2.0 und 64,4 % bei Finance Agent
- In Coding-Benchmarks 13 % besser als Opus 4.6, Verdreifachung der Lösungsrate bei Produktions-Tasks
- Neue Funktion zur Selbstverifikation (Self-Verification): entwirft und führt vor Abschluss einer Aufgabe eigenständig Verifikationsschritte aus
- 3,3-fach höher auflösende Vision (bis zu 2.576 px), neuer Tokenizer
- Neues xhigh-effort-Level hinzugefügt, agentisches Reasoning um 14 % verbessert, Tool-Fehler auf ein Drittel reduziert
- Preis identisch zu Opus 4.6 ($5/$25 pro MTok)
- Anthropic räumt selbst ein, dass die Leistung unter dem nicht öffentlich verfügbaren Modell Mythos liegt
Auch auf Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry verfügbar.
1 Kommentare
OPUS 4.7 > GPT 5.4 > OPUS 4.6