MiniMax-M3 feiert Debüt, übertrifft GPT-5.5 und Gemini 3.1 Pro in wichtigen Benchmarks bei nur 5–10 % der Kosten

(venturebeat.com)

12 Punkte von recast7838 2026-06-02 | 6 Kommentare | Auf WhatsApp teilen

Das chinesische AI-Startup MiniMax hat das multimodale Large Language Model "M3" auf Basis offener Gewichte vorgestellt, das GPT-5.5 und Gemini 3.1 Pro übertrifft und dabei nur 5–10 % der Kosten bisheriger kommerzieller US-Modelle verursacht.

Vollständige Übersetzung

Das chinesische AI-Startup MiniMax hat mit der überraschenden Vorstellung des multimodalen Large Language Models "M3" mit Frontier-Niveau bei der Coding-Performance und einem Kontextfenster von 1 Million Token für erhebliche Unruhe auf dem globalen Markt für Enterprise-AI gesorgt. M3 soll innerhalb der nächsten 10 Tage über Hugging Face und GitHub unter einer Open-Weights-Open-Source-Lizenz verteilt werden, sodass Unternehmen es lokal auf interne Server herunterladen und eigene Optimierungen vornehmen können. Derzeit wird es zu einem Einführungspreis von 0,30 US-Dollar pro 1 Million Eingabe-Token und 1,20 US-Dollar pro Ausgabe-Token angeboten (Gesamtkosten 1,50 US-Dollar {b:4}); selbst zum regulären Preis liegt es damit nur bei 8–20 % {p:14} der Kosten großer kommerzieller US-Modelle und übertrifft Google, OpenAI, Anthropic und andere US-Techgiganten in puncto Kosten deutlich.

Der entscheidende Grund für diese drastische Kostensenkung ist die Architektur "MiniMax Sparse Attention (MSA)", die das Problem der explodierenden quadratischen Rechenkosten klassischer Transformer löst. Die MSA-Technologie maximiert die Hardware-Effizienz, indem sie Daten in hochpräzise Blöcke aufteilt und nur die benötigten Queries dynamisch zuordnet; beim Verarbeiten von 1 Million Token senkt sie den Rechenaufwand auf ein Zwanzigstel des bisherigen Niveaus {p:5} und steigert die Decoding-Geschwindigkeit um das 15-Fache. Auf Basis dieser strukturellen Innovation erzielte M3 auf SWE-Bench Pro, das die Fähigkeit zur autonomen Softwareentwicklung bewertet, 59,0 % {p:59} und überholte damit die geschlossenen Modelle GPT-5.5 und Gemini 3.1 Pro; auch bei Web-Browsing- und Information-Retrieval-Leistung (BrowseComp 83,5 % {p:84}) übertraf es den bisherigen Rekord von Claude Ops 4.7.

Im Vergleich zum kürzlich veröffentlichten leistungsstärksten geschlossenen Modell Claude Ops 4.8 (SWE-Bench Pro 69,2 % {b:59,69}) gibt es im Bereich extrem anspruchsvoller Schlussfolgerungen zwar noch gewisse Leistungsunterschiede, doch M3 bietet auch ohne massive API-Abonnementkosten einen starken lokalen Referenzpunkt für Automatisierung. Zudem stellte MiniMax zusammen mit M3 die Agenten-Produktreihe "MiniMax Code" vor, die selbstständig Code schreibt, unabhängige Verifizierungsschleifen ausführt und sich autonom korrigiert; dafür wurde ein aggressives Preismodell ab 20 US-Dollar pro Monat (Plus) eingeführt. In Unternehmensumgebungen, in denen strenger Datenschutz und Compliance unverzichtbar sind, dürfte die Bereitstellung von M3 als Open Weights das Risiko von Datenabfluss über die Cloud grundsätzlich ausschalten und ein außergewöhnlich gutes Preis-Leistungs-Verhältnis bieten, indem es als unternehmenseigener Kernwert internalisiert werden kann.

Ein Satz des Autors

Ich sollte es mal in der ollama-Cloud ausprobieren.

6 Kommentare

jimmy2056 2026-06-03

Da es sich um ein chinesisches Modell handelt, ist die Nutzung per API eher heikel; gut wäre, wenn man es lokal betreiben könnte.

recast7838 2026-06-02

Ich nutze es gerade, und anders als bei anderen chinesischen Modellen gibt es nicht das Problem, dass beim Schreiben plötzlich Chinesisch auftaucht. Tool Calls scheint es auch gut zu beherrschen.

somang04 2026-06-08

Ich nutze das minimax-Abo-Modell; für 100 Dollar im Jahr kann man es mehr als großzügig verwenden. Man kann damit sogar täglich bis zu 100 Musikstücke erzeugen. (Manchmal kommt allerdings auch völlig absurd ein im C-pop-Stil produzierter chinesischsprachiger Song heraus …) Als kleinere Version von suno oder flow und für die Erstellung von BGM scheint es ziemlich gut geeignet zu sein.

Für Coding oder den Agent-Bereich habe ich es allerdings noch nicht ausprobiert. Ich sollte es wohl im Vergleich zu den APIs von gemini / open ai / anthropic testen.

vndk2234 2026-06-03

Wie kommt es, dass der Preis auf dem Niveau von GPT Nano liegt ...
Wenn man bei der Nutzung von KI nicht gerade seinen Personalausweis hochlädt, dürfte es wohl kein großes Problem sein, etwas aus China zu verwenden.

runableapp 2026-06-03

Da es ein chinesisches Modell ist, zögere ich nach wie vor ein wenig, es zu nutzen. Gleichzeitig frage ich mich aber auch, wie stark US-Unternehmen ihre Servicepreise angehoben hätten, wenn es solche chinesischen Dienste nicht gäbe. Ich habe sogar den Verdacht, dass Trumps entsprechende Politik damit in irgendeinem Zusammenhang stehen könnte.

b8g6pn 2026-06-02

Dass das Modell mithalten kann, ist als Maßstab wohl tatsächlich etwas übertrieben, aber der Preis ist schon schockierend.

MiniMax-M3 feiert Debüt, übertrifft GPT-5.5 und Gemini 3.1 Pro in wichtigen Benchmarks bei nur 5–10 % der Kosten

Vollständige Übersetzung

Ein Satz des Autors

Verwandte Beiträge

6 Kommentare