Veröffentlichung von GLM 5.2
(twitter.com/jietang)- GLM-5.2 ist ein Open-Source-Modell, das ein praktisch nutzbares 1M-Kontextfenster sowie die eigenständige Bearbeitung langfristiger Aufgaben unterstützt und damit eine Grundlage für den Aufbau komplexer Agent-Anwendungen bietet
- In einer Situation, in der der Zugang zu Frontier-Modellen aus nichttechnischen Gründen plötzlich blockiert wird, sollte Wissenschaft global sein, und der Weg zu AGI darf nicht hinter hohen Barrieren eingeschlossen werden
- AGI sollte kein Privileg sein, das von den Regeln weniger monopolisiert und jederzeit wieder entzogen werden kann, sondern eine gemeinsame Grundlage, auf der die Menschheit gemeinsam die Grenzen der Intelligenz erforscht und komplexe Aufgaben löst
- GLM-5.2 ist Zhipus bislang leistungsstärkstes Open-Source-Modell und dient weiterhin als Hauptmotor für den Aufbau des stärksten Coding-Modells des Landes
- Es wird zunächst Nutzern des GLM Coding Plan in Lite / Pro / Max bereitgestellt, und die API soll nächste Woche veröffentlicht werden, wodurch der Zugang zu Frontier-Intelligenz einen Schritt näher rückt
Kernbotschaften
- Die plötzliche Einschränkung eines bestimmten Frontier-Modells wird als zutiefst bedauerlich dargestellt; gerade in Momenten, in denen der Zugang aus nichttechnischen Gründen unterbrochen wird, wird die Position bekräftigt, dass Wissenschaft global sein sollte
- Der Weg zu AGI sollte nicht von hohen Barrieren umgeben sein, und AGI sollte ein Grundpfeiler sein, auf dem die Menschheit gemeinsam die Grenzen der Intelligenz erforscht und komplexe Herausforderungen löst
- AGI sollte kein Privileg sein, das von den Regeln weniger monopolisiert und jederzeit wieder entzogen werden kann; angesichts externer Abschottung und Beschränkungen ist radikale Offenheit notwendig
- Frontier-Intelligenz sollte Open Source, zugänglich und aufbaubar bleiben und allen engagierten Entwicklern zur Verfügung stehen
Veröffentlichung und Verfügbarkeit von GLM-5.2
- GLM-5.2 ist das bislang leistungsstärkste Open-Source-Modell, das Zhipu veröffentlicht hat
- Dieses Modell unterstützt ein praktisch nutzbares 1M-Kontextfenster und behauptet einen anhaltenden Vorsprung bei der eigenständigen Erledigung langfristiger Aufgaben
- Es bietet eine robuste Grundlage für die Entwicklung komplexer Agent-Anwendungen und dient weiterhin als Hauptmotor für den Aufbau des stärksten Coding-Modells des Landes
- GLM-5.2 wird um 5:21 Uhr offiziell für Nutzer des GLM Coding Plan bereitgestellt; dazu zählen alle Lite / Pro / Max-Nutzer
- Die API soll nächste Woche veröffentlicht werden, und der ModelKey ist
GLM-5.2
1 Kommentare
Hacker-News-Kommentare
Laut der Ankündigung des Z.ai-Gründers ist GLM-5.2 ein „vollständig offenes“ Modell, und in einer Situation, in der der Zugang zu einigen Frontier-Modellen aus nichttechnischen Gründen plötzlich eingeschränkt wird, sollte Frontier-Intelligenz allen offenstehen
GLM-5.2 ist Zhipus bislang stärkstes Open-Source-Modell und wirbt mit einem praktisch nutzbaren 1M-Kontextfenster sowie der Fähigkeit, langfristige Aufgaben eigenständig auszuführen
Es wird zunächst für Nutzer von GLM Coding Plan Lite / Pro / Max bereitgestellt, die API soll laut Ankündigung nächste Woche veröffentlicht werden
https://x.com/jietang/status/2065784751345287314
Das scheint anders zu sein als bei anderen chinesischen Open-Weights-Modellen wie Qwen
Es scheint noch keinen offiziellen Blogpost mit Benchmark-Ergebnissen zu geben, aber ich bin chinesischen AI-Laboren wieder dankbar dafür, dass sie solche Arbeiten veröffentlichen und der Welt mit permissiven Lizenzen etwas zurückgeben
Die Fable-5-Sache zeigt erneut, wie wertvoll solche offenen Modelle sind
Trotzdem ziemlich beeindruckend und absolut brauchbar
Bei Architektur oder komplexen Problemen ist es merklich schwächer, aber das haben wohl die wenigsten anders erwartet
Besonders bei Design und Benutzeroberfläche scheint es über seiner Gewichtsklasse zu spielen, wobei das auch persönlicher Geschmack sein kann
In den letzten Tagen haben chinesische Labore MiniMaxM3, KimiK2.7 und GLM5.2 veröffentlicht, während die USA in derselben Zeit Modelle zensieren
Es liest sich fast wie ein Roman
Man kann das aktuelle Anthropic-Thema wohl als Modellzensur durch die USA bezeichnen, aber allgemeine Korruption, Vergeltung, Erpressung und Inkompetenz der Trump-Regierung trifft es für mich eher
Offenbar ist es nicht die erhoffte C++-Bibliothek OpenGL Mathematics
Wenn man sich die jüngsten Aktionen der US-Regierung bei Fable ansieht, wirkt diese Entwicklung immer mehr wie die Zukunft
Man kann sich nicht auf strategische Produkte verlassen, deren Türen von launischen Akteuren abgeschlossen werden können
Open-Weights-Modelle sind dagegen grundsätzlich fast immun
Die US-Regierung könnte es für illegal erklären, mit ausländischen Open-Weights-Modellen Geschäfte zu machen, sie herunterzuladen oder zu verwenden
Gegen Privatpersonen wäre das schwer durchzusetzen, aber Unternehmen würden sich grundsätzlich daran halten, und wenn es über Sanktionen läuft, könnte es auch von US-basiertem Hosting wie GitHub verschwinden
Außerdem bewegen wir uns bereits schnell auf ein erschreckendes Niveau massiver Überwachung zu, was die Durchsetzung zusätzlich unterstützen könnte
Die Fable-Situation schafft einen sehr gefährlichen Präzedenzfall, und ich mache mir Sorgen um die Zukunft, weil wir den Kampf um Informations- und Rechenfreiheit offenbar verlieren
Anthropic feuert diesen Unsinn an
Ohne Ankündigung wird die Qualität der Ergebnisse verschlechtert, und Anfragen werden im Namen der „Sicherheit“ abgelehnt
Selbst wenn die Regierung nicht verlangt hätte, das Modell für Ausländer abzuschalten, wäre die Lage wegen Anthropic selbst immer noch ausgesprochen schlecht gewesen
Die Veröffentlichung erfolgte genau zur selben Zeit, 17:21 Uhr chinesischer Zeit, als Anthropic den Fable-Sperrbrief von der Regierung erhalten hat, und sie erwähnt ausdrücklich die Situation, dass andere Modelle unbenutzbar werden
Das wirkt ziemlich seltsam
Vielleicht wurde der Beitrag später bearbeitet
Diese Veröffentlichung scheint überhastet vorgezogen worden zu sein, um auf der Mythos-Dramatik mitzuschwimmen
So nach dem Motto: „Schade, dass ihr Fable nicht mehr nutzen könnt, aber probiert übers Wochenende doch unseres aus“, und möglicherweise war die Veröffentlichung eigentlich erst für nächste Woche geplant, weshalb die Benchmarks noch nicht komplett fertig scheinen
Ich hoffe auf die Veröffentlichung von 5.2 flash
Es ist schon etwas her, aber 4.7 flash fühlt sich für mich immer noch wie eines der stärksten lokalen Coding-Modelle an
Bei lokalen Modellen ist Qwen-3.5 weiterhin das Beste
3.6 geht beim VRAM-Verbrauch leicht über 24 GB hinaus, und ab da nutzt man im Grunde keine Consumer-GPU mehr
Ich hätte gern einen Blogpost, der die Fähigkeiten des neuen Modells behandelt: was man erwarten kann, ob es günstiger ist, schneller ist, ob die Ausgabequalität besser ist usw.
Trotzdem danke für die Veröffentlichung
Mich würde interessieren, wie viel Rechenressourcen tatsächlich nötig sind und welche Anforderungen die verschiedenen Varianten haben
Ich würde auch gern wissen, ob Optimierungen von Google wie TurboQuant, MTP oder eigene Innovationen enthalten sind, die Frontier-Qualität für lokale Nutzer realistisch verfügbar machen
Im vernünftigen Sinn ist das kein lokales Modell, aber da es ein offenes Modell ist, werden wohl in etwa einer Woche, wenn die Gewichte verfügbar sind, mehrere Drittanbieter für Inferenz auftauchen, die beim Preis pro Token konkurrieren
Es gibt keine lokalen Modelle, die auf Consumer-Hardware effektiv laufen, und wer etwas anderes behauptet, lügt oder lebt in einer Wahnvorstellung