- Magistral ist das erste von Mistral AI veröffentlichte Reasoning-Modell, das auf domänenspezifisches, transparentes und mehrsprachiges Schlussfolgern spezialisiert ist
- Erscheint in zwei Varianten: als Open-Source-Modell Magistral Small (24B Parameter) und als Enterprise-Version Magistral Medium
- Bietet mehrsprachiges Schlussfolgern auf Basis von Chain of Thought und stellt den schrittweisen logischen Prozess transparent in der Sprache der Nutzer bereit
- Zeigt bei AIME2024 eine Leistung von 73,6 % für Magistral Medium (Bestwert 90 %) und 70,7 % für Small (Bestwert 83,3 %)
- Unterstützt präzise schrittweise logische Herleitungen und 10-mal schnellere Antwortgeschwindigkeiten für verschiedene Sprachen und Branchen wie regulierte Industrien, Recht, Finanzen, Gesundheitswesen, Data Engineering, Softwareentwicklung und kreative Inhalte
Magistral — Mistral AI stellt sein erstes Reasoning-Modell vor
- Magistral ist ein Reasoning-Modell mit Fokus auf praktische Problemlösung und feedbackbasierte Verbesserung
- Magistral Small ist die Open-Source-Version mit 24B Parametern, Magistral Medium die leistungsstärkere Enterprise-Version
- Leistungskennzahlen:
- Magistral Medium: 73,6 % bei AIME2024, 90 % mit Majority Voting
- Magistral Small: 70,7 % bzw. 83,3 %
- Nutzt Chain-of-Thought-Argumentation auf Basis globaler Sprachen und Schriftsysteme, wodurch Denkprozesse auf muttersprachlichem Niveau möglich werden
- Geeignet für strukturierte Berechnungen, Programmierlogik, Entscheidungsbäume und regelbasierte Systeme
- Mit Think mode und Flash Answers in Le Chat werden Antwortgeschwindigkeiten gegenüber Wettbewerbern um das 10-Fache verbessert
- Das offizielle Paper enthält eine Bewertung von Algorithmen, Trainingsinfrastruktur, Reinforcement-Learning-Methoden und Trainingserkenntnissen
Modell- und Technikdetails
- Transparenter Reasoning-Prozess:
- Magistral ist auf mehrstufige Logik optimiert, sodass Nutzer den Schlussfolgerungsprozess in ihrer eigenen Sprache prüfen und nachverfolgen können
- Im Unterschied zu allgemeinen Modellen sind Interpretierbarkeit und Verifizierbarkeit stärker ausgebaut
- Ziel sind kontinuierliche Modell-Updates und schnelle Verbesserungen
- Mehrsprachiges Schlussfolgern: hohe Genauigkeit und stabile Logik in Englisch, Französisch, Spanisch, Deutsch, Italienisch, Arabisch, Russisch, Chinesisch und weiteren Sprachen
- Antwortgeschwindigkeit:
- Magistral Medium unterstützt über Flash Answers in Le Chat Echtzeit-Reasoning und Feedback mit einer 10-mal höheren Token-Verarbeitungsgeschwindigkeit als Wettbewerber
- Zeigt eine überlegene Geschwindigkeit gegenüber führenden Konkurrenzmodellen wie ChatGPT
Open Source und Community-Beteiligung
- Magistral Small wird unter der Apache-2.0-Lizenz veröffentlicht
- Nutzer können Struktur und Reasoning-Ansatz direkt analysieren, modifizieren und neu zusammensetzen
- Frühere Open-Source-Modelle wurden in innovativen Forschungsprojekten wie ether0 und DeepHermes 3 eingesetzt
Breite Einsatzmöglichkeiten
- Magistral ist für Bereiche optimiert, in denen präzises schrittweises Schlussfolgern und Transparenz wichtig sind, etwa Recht, Finanzen, Softwareentwicklung und Storytelling
-
Geschäftsstrategie und Betrieb
- Kann für strategische Planung, Risikobewertung, datenbasierte Entscheidungen und die Berechnung optimaler Lösungen unter komplexen Nebenbedingungen eingesetzt werden
-
Regulierte Industrien und öffentlicher Sektor
- Fachleute aus Recht, Finanzen, Gesundheitswesen und Behörden können logische Schlussfolgerungspfade nachverfolgen und Auditierbarkeit sicherstellen
- Unterstützt die Prüfbarkeit von Ergebnissen und die Einhaltung regulatorischer Vorgaben
-
Systeme, Software und Data Engineering
- Verbessert gegenüber nicht auf Reasoning ausgelegten LLMs die Qualität der Unterstützung in Programmierung, Projektdesign, Backend-Architektur und Data Engineering
- Besonders wirksam bei mehrstufigen Aufgaben wie der Anbindung externer Tools und APIs
-
Content-Erstellung und Kommunikation
- Magistral liefert auch bei kreativem Schreiben und Storytelling starke Ergebnisse
- Kann nicht nur konsistente Texte erzeugen, sondern auch originelle und ungewöhnliche Ideen entwickeln
Nutzung und Bereitstellungswege
- Die Small-Version kann heruntergeladen und selbst bereitgestellt werden
- Die Medium-Version ist sofort über Le Chat (Web), API und Amazon SageMaker nutzbar
- Zusätzliche Unterstützung für IBM WatsonX, Azure AI und Google Cloud Marketplace ist in Kürze geplant
- Unternehmensspezifische On-Premises-Einführungen sind auf Anfrage möglich
1 Kommentare
Hacker-News-Kommentare
ollama run hf.co/unsloth/Magistral-Small-2506-GGUF:UD-Q4_K_XLausführen, und für llama.cpp wird dringend empfohlen, Optionen wie--jinja,--temp 0.7und--top-p 0.95zu verwenden. Es wird außerdem empfohlen, die Kontextlänge in Ollama auf mehr als 8192 zu erhöhen; weitere Hinweise gibt es in der offiziellen Dokumentation