Die wichtigsten Punkte zum MiniMax-M2-Modell
- Modellüberblick: Das M2-Modell von MiniMax aus China (23 Milliarden Parameter, selektiv aktivierte Architektur) zeigt eine Leistung, die Claude Opus 4.1 übertrifft, bei Kosten von nur 8 % von Claude Sonnet ($0,30 pro 1 Million Input-Token) und doppelter Geschwindigkeit.
- Effizienzinnovation: Durch die MoE-Architektur werden nur die benötigten Parameter aktiviert, was die Kosten um 92 % senkt; entwickelt mit Fokus auf die Praxis (Lösung komplexer Coding- und Agentenaufgaben).
- Benchmark-Leistung: 61 Punkte im Intelligence Index (Platz 1 unter Open-Source-Modellen), 69,4 Punkte bei SWE-bench, 46,3 Punkte bei Terminal-Bench und 44 Punkte bei BrowseComp – damit liegt es nahe an Claude- und Gemini-Modellen oder übertrifft sie deutlich.
- Praxisanwendung: Stark in Mathematik, Coding und Agenten-Workflows (Datenanalyse, Untersuchung von Issues, Programmierung); Entwicklertests belegen die Fähigkeit zur Fehlerbehebung.
- Verwendung: Kostenlos über den Webdienst (https://agent.minimax.io/) nutzbar, per API integrierbar; empfohlen wird der Download der Open-Source-Version auf Hugging Face (MIT-Lizenz, bestimmte Konfiguration erforderlich).
- Bedeutung: Mit dem Aufstieg von Open-Source-Modellen verlagert sich der KI-Wettbewerb hin zu Effizienz und Praxistauglichkeit.
3 Kommentare
Bei 23B (im Haupttext sind es 230B) war ich kurz begeistert, weil ich dachte, das könnte man sogar auf einem Mac mini laufen lassen..
Ich auch … Als ich hörte, dass 23B auf dem Niveau von Claude 4.1 Opus sein soll, habe ich bei Hugging Face nachgesehen, war dann aber enttäuscht, weil es 230B waren …
Es sind nicht 23 Milliarden, sondern 230 Milliarden Parameter.