1 Punkte von recast7838 3 시간 전 | 2 Kommentare | Auf WhatsApp teilen

Das chinesische AI-Startup MiniMax hat das multimodale Large Language Model "M3" auf Basis offener Gewichte vorgestellt, das GPT-5.5 und Gemini 3.1 Pro übertrifft und dabei nur 5–10 % der Kosten bisheriger kommerzieller US-Modelle verursacht.


Vollständige Übersetzung

Das chinesische AI-Startup MiniMax hat mit der überraschenden Vorstellung des multimodalen Large Language Models "M3" mit Frontier-Niveau bei der Coding-Performance und einem Kontextfenster von 1 Million Token für erhebliche Unruhe auf dem globalen Markt für Enterprise-AI gesorgt. M3 soll innerhalb der nächsten 10 Tage über Hugging Face und GitHub unter einer Open-Weights-Open-Source-Lizenz verteilt werden, sodass Unternehmen es lokal auf interne Server herunterladen und eigene Optimierungen vornehmen können. Derzeit wird es zu einem Einführungspreis von 0,30 US-Dollar pro 1 Million Eingabe-Token und 1,20 US-Dollar pro Ausgabe-Token angeboten (Gesamtkosten 1,50 US-Dollar {b:4}); selbst zum regulären Preis liegt es damit nur bei 8–20 % {p:14} der Kosten großer kommerzieller US-Modelle und übertrifft Google, OpenAI, Anthropic und andere US-Techgiganten in puncto Kosten deutlich.

Der entscheidende Grund für diese drastische Kostensenkung ist die Architektur "MiniMax Sparse Attention (MSA)", die das Problem der explodierenden quadratischen Rechenkosten klassischer Transformer löst. Die MSA-Technologie maximiert die Hardware-Effizienz, indem sie Daten in hochpräzise Blöcke aufteilt und nur die benötigten Queries dynamisch zuordnet; beim Verarbeiten von 1 Million Token senkt sie den Rechenaufwand auf ein Zwanzigstel des bisherigen Niveaus {p:5} und steigert die Decoding-Geschwindigkeit um das 15-Fache. Auf Basis dieser strukturellen Innovation erzielte M3 auf SWE-Bench Pro, das die Fähigkeit zur autonomen Softwareentwicklung bewertet, 59,0 % {p:59} und überholte damit die geschlossenen Modelle GPT-5.5 und Gemini 3.1 Pro; auch bei Web-Browsing- und Information-Retrieval-Leistung (BrowseComp 83,5 % {p:84}) übertraf es den bisherigen Rekord von Claude Ops 4.7.

Im Vergleich zum kürzlich veröffentlichten leistungsstärksten geschlossenen Modell Claude Ops 4.8 (SWE-Bench Pro 69,2 % {b:59,69}) gibt es im Bereich extrem anspruchsvoller Schlussfolgerungen zwar noch gewisse Leistungsunterschiede, doch M3 bietet auch ohne massive API-Abonnementkosten einen starken lokalen Referenzpunkt für Automatisierung. Zudem stellte MiniMax zusammen mit M3 die Agenten-Produktreihe "MiniMax Code" vor, die selbstständig Code schreibt, unabhängige Verifizierungsschleifen ausführt und sich autonom korrigiert; dafür wurde ein aggressives Preismodell ab 20 US-Dollar pro Monat (Plus) eingeführt. In Unternehmensumgebungen, in denen strenger Datenschutz und Compliance unverzichtbar sind, dürfte die Bereitstellung von M3 als Open Weights das Risiko von Datenabfluss über die Cloud grundsätzlich ausschalten und ein außergewöhnlich gutes Preis-Leistungs-Verhältnis bieten, indem es als unternehmenseigener Kernwert internalisiert werden kann.

Ein Satz des Autors

Ich sollte es mal in der ollama-Cloud ausprobieren.

2 Kommentare

 
b8g6pn 3 시간 전

Dass das Modell mithalten kann, ist als Maßstab wohl tatsächlich etwas übertrieben, aber der Preis ist schon schockierend.

 
recast7838 3 시간 전

Ich nutze es gerade, und anders als bei anderen chinesischen Modellen gibt es nicht das Problem, dass beim Schreiben plötzlich Chinesisch auftaucht. Tool Calls scheint es auch gut zu beherrschen.