2 Punkte von minodevs 13 일 전 | 1 Kommentare | Auf WhatsApp teilen

Anthropic hat sein Flaggschiffmodell Claude Opus 4.7 veröffentlicht.

  • Auf SWE-bench Verified 87,6 % (+6,8 Prozentpunkte) und auf SWE-bench Pro 64,3 % und damit vor GPT-5.4 (57,7 %) auf Platz 1
  • Erreicht 94,2 % bei GPQA Diamond, 69,4 % bei Terminal-Bench 2.0 und 64,4 % bei Finance Agent
  • In Coding-Benchmarks 13 % besser als Opus 4.6, Verdreifachung der Lösungsrate bei Produktions-Tasks
  • Neue Funktion zur Selbstverifikation (Self-Verification): entwirft und führt vor Abschluss einer Aufgabe eigenständig Verifikationsschritte aus
  • 3,3-fach höher auflösende Vision (bis zu 2.576 px), neuer Tokenizer
  • Neues xhigh-effort-Level hinzugefügt, agentisches Reasoning um 14 % verbessert, Tool-Fehler auf ein Drittel reduziert
  • Preis identisch zu Opus 4.6 ($5/$25 pro MTok)
  • Anthropic räumt selbst ein, dass die Leistung unter dem nicht öffentlich verfügbaren Modell Mythos liegt

Auch auf Amazon Bedrock, Google Cloud Vertex AI und Microsoft Foundry verfügbar.

1 Kommentare

 
runai 12 일 전

OPUS 4.7 > GPT 5.4 > OPUS 4.6