19 Punkte von humblebee 2025-05-23 | 2 Kommentare | Auf WhatsApp teilen

Anthropic hat am 23. Mai 2025 die Claude-4-Serie veröffentlicht. Die nun vorgestellten Modelle Claude Opus 4 und Claude Sonnet 4 verbessern gegenüber den Vorgängerversionen insbesondere das Coding und die Fähigkeit, lang andauernde Aufgaben auszuführen. Der Preis bleibt dabei unverändert.

  1. Fähigkeit zu lang andauernder Arbeit

    • 7 Stunden ununterbrochene Arbeit: Bei einem von Rakuten überprüften Open-Source-Refactoring wurde 7 Stunden lang selbstständig gearbeitet
    • Auch komplexe Aufgaben mit Tausenden von Schritten werden ohne Unterbrechung verarbeitet
    • Eine Arbeitsausdauer, die die Grenzen bisheriger AI-Agenten deutlich übertrifft
  2. Verbessertes Speichersystem

    • Erstellt automatisch Memory-Dateien wie einen „Navigation Guide“, um das Situationsverständnis bei langfristigen Aufgaben zu verbessern
    • Praktische Nutzung von Memory, etwa indem beim Spielen von Pokémon selbst ein Navigationsleitfaden geschrieben wird
    • Im Vergleich zum Vorgängermodell 65 % weniger Verhalten, das Abkürzungen oder Schlupflöcher ausnutzt
  3. Hybrides Reasoning-Modell

    • Sofortantwort-Modus: wenn schnelle Antworten benötigt werden
    • Erweiterter Denkmodus: tiefgehendes Reasoning mit bis zu 64K Tokens
    • Automatischer Wechsel zwischen beiden Modi je nach Situation
  4. Tool-Nutzung

    • Parallele Tool-Ausführung: mehrere Tools gleichzeitig nutzen, um die Effizienz zu steigern
    • Tool-Nutzung während des Denkprozesses: nutzt während des Reasoning-Prozesses Websuche usw., um präzisere Antworten zu erzeugen
  5. Verbesserte Codequalität

    • Block-Bewertung: „das erste Modell, das die Codequalität beim Editieren und Debugging verbessert hat“
    • iGent-Bericht: Fehlerquote bei der Navigation in Codebases von 20 % auf nahezu 0 % gesenkt
    • Sourcegraph: elegantere Codequalität und tieferes Problemverständnis
  6. Praxisintegration von Claude Code

    • Direkte IDE-Integration: Codeänderungen werden sofort im Editor angezeigt
    • GitHub-PR-Unterstützung: verarbeitet automatisch Feedback von PR-Reviewern und behebt CI-Fehler
    • Hintergrundaufgaben: Unterstützung für Automatisierung über GitHub Actions
    • Erweiterbares SDK: Entwickler können eigene Agenten bauen
  7. Neue API-Funktionen

    • Tool zur Codeausführung
    • MCP-Connector
    • Files API
    • Prompt-Caching von bis zu 1 Stunde
  8. Sicherheit

    • Umsetzung von ASL-3-Schutzmaßnahmen (AI Safety Level 3)
    • Präzisere Befolgung von Anweisungen
    • Verantwortungsbewussteres Verhalten mit geringerem Missbrauchspotenzial

2 Kommentare

 
humblebee 2025-05-23

Dort steht, dass 7 Stunden lang ohne Unterbrechung Refactoring durchgeführt wurde; wenn die Qualität stimmt, könnte man vielleicht sogar ein hochwertiges Outsourcing-Niveau erwarten, bei dem Entwickler es nach Feierabend laufen lassen und am nächsten Tag das Ergebnis prüfen 😂

 
sinbumu 2025-05-23

Diesen Punkt hat man erkannt, deshalb testen Unternehmen wie Google derzeit probeweise Coding-Agenten wie Jules in der Beta ... Wenn man der AI Aufgaben zuwirft, werkelt sie nicht lokal, sondern selbstständig in einer Cloud-Umgebung vor sich hin, und später schaut man sich das Ergebnis an und lässt sie committen, deployen und Ähnliches.