Anthropic veröffentlicht Claude 4
(anthropic.com)Anthropic hat am 23. Mai 2025 die Claude-4-Serie veröffentlicht. Die nun vorgestellten Modelle Claude Opus 4 und Claude Sonnet 4 verbessern gegenüber den Vorgängerversionen insbesondere das Coding und die Fähigkeit, lang andauernde Aufgaben auszuführen. Der Preis bleibt dabei unverändert.
-
Fähigkeit zu lang andauernder Arbeit
- 7 Stunden ununterbrochene Arbeit: Bei einem von Rakuten überprüften Open-Source-Refactoring wurde 7 Stunden lang selbstständig gearbeitet
- Auch komplexe Aufgaben mit Tausenden von Schritten werden ohne Unterbrechung verarbeitet
- Eine Arbeitsausdauer, die die Grenzen bisheriger AI-Agenten deutlich übertrifft
-
Verbessertes Speichersystem
- Erstellt automatisch Memory-Dateien wie einen „Navigation Guide“, um das Situationsverständnis bei langfristigen Aufgaben zu verbessern
- Praktische Nutzung von Memory, etwa indem beim Spielen von Pokémon selbst ein Navigationsleitfaden geschrieben wird
- Im Vergleich zum Vorgängermodell 65 % weniger Verhalten, das Abkürzungen oder Schlupflöcher ausnutzt
-
Hybrides Reasoning-Modell
- Sofortantwort-Modus: wenn schnelle Antworten benötigt werden
- Erweiterter Denkmodus: tiefgehendes Reasoning mit bis zu 64K Tokens
- Automatischer Wechsel zwischen beiden Modi je nach Situation
-
Tool-Nutzung
- Parallele Tool-Ausführung: mehrere Tools gleichzeitig nutzen, um die Effizienz zu steigern
- Tool-Nutzung während des Denkprozesses: nutzt während des Reasoning-Prozesses Websuche usw., um präzisere Antworten zu erzeugen
-
Verbesserte Codequalität
- Block-Bewertung: „das erste Modell, das die Codequalität beim Editieren und Debugging verbessert hat“
- iGent-Bericht: Fehlerquote bei der Navigation in Codebases von 20 % auf nahezu 0 % gesenkt
- Sourcegraph: elegantere Codequalität und tieferes Problemverständnis
-
Praxisintegration von Claude Code
- Direkte IDE-Integration: Codeänderungen werden sofort im Editor angezeigt
- GitHub-PR-Unterstützung: verarbeitet automatisch Feedback von PR-Reviewern und behebt CI-Fehler
- Hintergrundaufgaben: Unterstützung für Automatisierung über GitHub Actions
- Erweiterbares SDK: Entwickler können eigene Agenten bauen
-
Neue API-Funktionen
- Tool zur Codeausführung
- MCP-Connector
- Files API
- Prompt-Caching von bis zu 1 Stunde
-
Sicherheit
- Umsetzung von ASL-3-Schutzmaßnahmen (AI Safety Level 3)
- Präzisere Befolgung von Anweisungen
- Verantwortungsbewussteres Verhalten mit geringerem Missbrauchspotenzial
2 Kommentare
Dort steht, dass 7 Stunden lang ohne Unterbrechung Refactoring durchgeführt wurde; wenn die Qualität stimmt, könnte man vielleicht sogar ein hochwertiges Outsourcing-Niveau erwarten, bei dem Entwickler es nach Feierabend laufen lassen und am nächsten Tag das Ergebnis prüfen 😂
Diesen Punkt hat man erkannt, deshalb testen Unternehmen wie Google derzeit probeweise Coding-Agenten wie Jules in der Beta ... Wenn man der AI Aufgaben zuwirft, werkelt sie nicht lokal, sondern selbstständig in einer Cloud-Umgebung vor sich hin, und später schaut man sich das Ergebnis an und lässt sie committen, deployen und Ähnliches.