9 Punkte von GN⁺ 2025-12-10 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Devstral 2 ist ein Open-Source-Coding-Modell der nächsten Generation mit 123B Parametern, das auf SWE-bench Verified eine Leistung von 72,2 % erreicht und dabei gegenüber Wettbewerbsmodellen eine hohe Effizienz erzielt
  • Devstral Small 2 läuft mit 24B Parametern auch auf Consumer-Hardware und wird unter der Apache 2.0-Lizenz veröffentlicht
  • Mistral Vibe CLI ist ein Open-Source-Terminal-Agent auf Basis von Devstral, der Code-Exploration, -Bearbeitung und -Ausführung per natürlicher Sprache ermöglicht
  • Devstral 2 ist bis zu 7-mal kosteneffizienter als Claude Sonnet und liefert trotz einer fünfmal kleineren Größe als DeepSeek V3.2 weiterhin hohe Leistung
  • In der Open-Source-Community wird es als zentrales Werkzeug für großskalige Codeautomatisierung und die Beschleunigung verteilter Intelligenz eingestuft

Überblick über Devstral 2

  • Devstral 2 ist ein 123B-Parameter-Dichtetransformer-Modell, das ein 256K-Kontextfenster unterstützt
    • Es erreicht auf SWE-bench Verified eine Leistung von 72,2 % und zählt damit zu den Modellen mit offenen Gewichten mit Spitzenwerten
    • Es wird unter einer modifizierten MIT-Lizenz veröffentlicht und setzt damit einen neuen Standard für Open-Source-Code-Agenten
  • Devstral Small 2 erreicht 68,0 % auf SWE-bench Verified und hält ein ähnliches Niveau wie Modelle, die bis zu fünfmal so groß sind
    • Lokale Ausführung auf Consumer-Hardware möglich, mit schneller Inferenz und personalisierten Feedback-Loops
    • Es unterstützt Bildeingaben und ermöglicht den Betrieb von multimodalen Agenten
  • Devstral 2 (123B) und Small 2 (24B) sind gegenüber DeepSeek V3.2 um das 5-fache bzw. 28-fache kleiner und gegenüber Kimi K2 um das 8-fache bzw. 41-fache
    • Durch die komprimierte Modellarchitektur lassen sie sich auch auf begrenzter Hardware leichter bereitstellen

Unterstützung produktionsreifer Workflows

  • Devstral 2 unterstützt Codebase-Exploration und die Verwaltung von Änderungen über mehrere Dateien und behält den Architekturkontext aufrecht
    • Dazu gehören Framework-Abhängigkeitsverfolgung, Fehlererkennung und automatischer Retry
    • Es kann Bugfixes und die Modernisierung von Legacy-Systemen durchführen
  • Fine-Tuning-Support für spezifische Sprachen und große Enterprise-Codebasen
  • In einem menschlichen Evaluierungsvergleich mit DeepSeek V3.2 und Claude Sonnet 4.5 liegt Devstral 2 deutlich vor DeepSeek (42,8 % Gewinnrate)
    • Zwischenzeitlich besteht jedoch weiterhin eine Leistungsdifferenz zu Claude Sonnet 4.5
  • Cline bezeichnet Devstral 2 als „eines der besten Open-Source-Coding-Modelle“ und sagt, dass die Tool-Call-Erfolgsquote ähnlich mit Closed-Source-Modellen ist
  • Kilo Code berichtet, dass in den ersten 24 Stunden nach dem Launch 17B Tokens genutzt wurden

Mistral Vibe CLI

  • Ein Open-Source-CLI-Coding-Assistent auf Devstral-Basis, der über natürliche Sprache Code-Exploration, -Änderung und -Ausführung ermöglicht
    • Wird unter der Apache 2.0-Lizenz veröffentlicht
    • Nutzbar im Terminal oder in der IDE (in Verbindung mit dem Agent Communication Protocol)
  • Hauptfunktionen
    • Projektbewusster Kontext: Automatisches Scannen von Dateistruktur und Git-Status
    • Intelligente Referenzen: @-Autovervollständigung, Ausführung von !-Kommandos, Slash-Kommandos zum Ändern von Einstellungen
    • Multi-File-Orchestrierung: Architekturbezogenes Schlussfolgern durch Verständnis der gesamten Codebasis
    • Unterstützung für kontinuierliche Historie, Autovervollständigung und Theme-Anpassung
  • Skript-Ausführung, automatischer Freigabe-Toggle, lokale Modelleinstellungen und Berechtigungssteuerung ermöglichen eine an den Workflow angepasste Konfiguration

Bereitstellung und Nutzung

  • Devstral 2 wird aktuell als kostenlose API angeboten; anschließend sind Preise von $0.40/$2.00 pro Ein- und Ausgabe geplant
    • Devstral Small 2 kostet $0.10/$0.30
  • Es lässt sich mit Open-Agent-Tools wie Kilo Code und Cline integrieren
  • Mit der Zed IDE-Erweiterung ist eine direkte Nutzung der Vibe CLI möglich
  • Devstral 2 erfordert Datacenter-GPU-Kapazität (mindestens 4×H100) und kann auf build.nvidia.com getestet werden
    • Devstral Small 2 kann auch in Einzel-GPU- oder CPU-Umgebungen ausgeführt werden
    • NVIDIA NIM-Unterstützung ist geplant
  • Für optimale Leistung wird die Einstellung der Temperatur auf 0.2 sowie die Best Practices der Vibe CLI empfohlen

Community und Recruiting

  • Mistral fördert die Freigabe von Projekten und die Teilnahme am Feedback mit Devstral 2, Small 2 und Vibe CLI
    • Austausch ist über X/Twitter, Discord und GitHub möglich
  • Personal für Open-Source-Forschung und Interface-Entwicklung wird gesucht; die Bewerbung ist über die offizielle Karriereseite von Mistral möglich

Noch keine Kommentare.

Noch keine Kommentare.