1 Punkte von GN⁺ 4 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • GLM-5.2 ist ein Open-Source-Modell, das ein praktisch nutzbares 1M-Kontextfenster sowie die eigenständige Bearbeitung langfristiger Aufgaben unterstützt und damit eine Grundlage für den Aufbau komplexer Agent-Anwendungen bietet
  • In einer Situation, in der der Zugang zu Frontier-Modellen aus nichttechnischen Gründen plötzlich blockiert wird, sollte Wissenschaft global sein, und der Weg zu AGI darf nicht hinter hohen Barrieren eingeschlossen werden
  • AGI sollte kein Privileg sein, das von den Regeln weniger monopolisiert und jederzeit wieder entzogen werden kann, sondern eine gemeinsame Grundlage, auf der die Menschheit gemeinsam die Grenzen der Intelligenz erforscht und komplexe Aufgaben löst
  • GLM-5.2 ist Zhipus bislang leistungsstärkstes Open-Source-Modell und dient weiterhin als Hauptmotor für den Aufbau des stärksten Coding-Modells des Landes
  • Es wird zunächst Nutzern des GLM Coding Plan in Lite / Pro / Max bereitgestellt, und die API soll nächste Woche veröffentlicht werden, wodurch der Zugang zu Frontier-Intelligenz einen Schritt näher rückt

Kernbotschaften

  • Die plötzliche Einschränkung eines bestimmten Frontier-Modells wird als zutiefst bedauerlich dargestellt; gerade in Momenten, in denen der Zugang aus nichttechnischen Gründen unterbrochen wird, wird die Position bekräftigt, dass Wissenschaft global sein sollte
  • Der Weg zu AGI sollte nicht von hohen Barrieren umgeben sein, und AGI sollte ein Grundpfeiler sein, auf dem die Menschheit gemeinsam die Grenzen der Intelligenz erforscht und komplexe Herausforderungen löst
  • AGI sollte kein Privileg sein, das von den Regeln weniger monopolisiert und jederzeit wieder entzogen werden kann; angesichts externer Abschottung und Beschränkungen ist radikale Offenheit notwendig
  • Frontier-Intelligenz sollte Open Source, zugänglich und aufbaubar bleiben und allen engagierten Entwicklern zur Verfügung stehen

Veröffentlichung und Verfügbarkeit von GLM-5.2

  • GLM-5.2 ist das bislang leistungsstärkste Open-Source-Modell, das Zhipu veröffentlicht hat
  • Dieses Modell unterstützt ein praktisch nutzbares 1M-Kontextfenster und behauptet einen anhaltenden Vorsprung bei der eigenständigen Erledigung langfristiger Aufgaben
  • Es bietet eine robuste Grundlage für die Entwicklung komplexer Agent-Anwendungen und dient weiterhin als Hauptmotor für den Aufbau des stärksten Coding-Modells des Landes
  • GLM-5.2 wird um 5:21 Uhr offiziell für Nutzer des GLM Coding Plan bereitgestellt; dazu zählen alle Lite / Pro / Max-Nutzer
  • Die API soll nächste Woche veröffentlicht werden, und der ModelKey ist GLM-5.2

1 Kommentare

 
GN⁺ 4 시간 전
Hacker-News-Kommentare
  • Laut der Ankündigung des Z.ai-Gründers ist GLM-5.2 ein „vollständig offenes“ Modell, und in einer Situation, in der der Zugang zu einigen Frontier-Modellen aus nichttechnischen Gründen plötzlich eingeschränkt wird, sollte Frontier-Intelligenz allen offenstehen
    GLM-5.2 ist Zhipus bislang stärkstes Open-Source-Modell und wirbt mit einem praktisch nutzbaren 1M-Kontextfenster sowie der Fähigkeit, langfristige Aufgaben eigenständig auszuführen
    Es wird zunächst für Nutzer von GLM Coding Plan Lite / Pro / Max bereitgestellt, die API soll laut Ankündigung nächste Woche veröffentlicht werden
    https://x.com/jietang/status/2065784751345287314

    • Das Gute an GLM ist, dass man es bei OpenRouter mit den Bedingungen US-basierter Anbieter und keine Datenspeicherung filtern kann
      Das scheint anders zu sein als bei anderen chinesischen Open-Weights-Modellen wie Qwen
    • Ich frage mich, ob „GLM-5.2 is Fully Open“ nur offene Gewichte bedeutet oder ob auch Quellcode und Daten offengelegt werden
  • Es scheint noch keinen offiziellen Blogpost mit Benchmark-Ergebnissen zu geben, aber ich bin chinesischen AI-Laboren wieder dankbar dafür, dass sie solche Arbeiten veröffentlichen und der Welt mit permissiven Lizenzen etwas zurückgeben
    Die Fable-5-Sache zeigt erneut, wie wertvoll solche offenen Modelle sind

    • Mein erster Eindruck ist, dass es gegenüber den Frontier-Laboren etwa 6 Monate zurückliegt und sich ungefähr wie Opus im Januar anfühlt
      Trotzdem ziemlich beeindruckend und absolut brauchbar
      Bei Architektur oder komplexen Problemen ist es merklich schwächer, aber das haben wohl die wenigsten anders erwartet
      Besonders bei Design und Benutzeroberfläche scheint es über seiner Gewichtsklasse zu spielen, wobei das auch persönlicher Geschmack sein kann
    • Ein Modell ohne Benchmarks zu veröffentlichen wirkt wie ein Signal, dass das Modell wahrscheinlich nicht besonders gut ist
  • In den letzten Tagen haben chinesische Labore MiniMaxM3, KimiK2.7 und GLM5.2 veröffentlicht, während die USA in derselben Zeit Modelle zensieren
    Es liest sich fast wie ein Roman

    • Ich frage mich, wie kimi2.7 im Vergleich zu GLM5.2 abschneidet
    • Chinesische Modelle werden auch zensiert
      Man kann das aktuelle Anthropic-Thema wohl als Modellzensur durch die USA bezeichnen, aber allgemeine Korruption, Vergeltung, Erpressung und Inkompetenz der Trump-Regierung trifft es für mich eher
  • Offenbar ist es nicht die erhoffte C++-Bibliothek OpenGL Mathematics

  • Wenn man sich die jüngsten Aktionen der US-Regierung bei Fable ansieht, wirkt diese Entwicklung immer mehr wie die Zukunft
    Man kann sich nicht auf strategische Produkte verlassen, deren Türen von launischen Akteuren abgeschlossen werden können
    Open-Weights-Modelle sind dagegen grundsätzlich fast immun

    • Das stimmt nur teilweise
      Die US-Regierung könnte es für illegal erklären, mit ausländischen Open-Weights-Modellen Geschäfte zu machen, sie herunterzuladen oder zu verwenden
      Gegen Privatpersonen wäre das schwer durchzusetzen, aber Unternehmen würden sich grundsätzlich daran halten, und wenn es über Sanktionen läuft, könnte es auch von US-basiertem Hosting wie GitHub verschwinden
      Außerdem bewegen wir uns bereits schnell auf ein erschreckendes Niveau massiver Überwachung zu, was die Durchsetzung zusätzlich unterstützen könnte
      Die Fable-Situation schafft einen sehr gefährlichen Präzedenzfall, und ich mache mir Sorgen um die Zukunft, weil wir den Kampf um Informations- und Rechenfreiheit offenbar verlieren
    • Sobald China gleichzieht oder vorne liegt, ist die Wahrscheinlichkeit sehr hoch, dass man auf Closed Source umstellt
    • Die Regierung zu kritisieren ist wahrscheinlich berechtigt, aber Anthropic darf dabei nicht einfach unter den Tisch fallen
      Anthropic feuert diesen Unsinn an
      Ohne Ankündigung wird die Qualität der Ergebnisse verschlechtert, und Anfragen werden im Namen der „Sicherheit“ abgelehnt
      Selbst wenn die Regierung nicht verlangt hätte, das Modell für Ausländer abzuschalten, wäre die Lage wegen Anthropic selbst immer noch ausgesprochen schlecht gewesen
  • Die Veröffentlichung erfolgte genau zur selben Zeit, 17:21 Uhr chinesischer Zeit, als Anthropic den Fable-Sperrbrief von der Regierung erhalten hat, und sie erwähnt ausdrücklich die Situation, dass andere Modelle unbenutzbar werden

    • Wirklich? Ich bin mir bei der Zeitzone nicht sicher
      Das wirkt ziemlich seltsam
      Vielleicht wurde der Beitrag später bearbeitet
  • Diese Veröffentlichung scheint überhastet vorgezogen worden zu sein, um auf der Mythos-Dramatik mitzuschwimmen
    So nach dem Motto: „Schade, dass ihr Fable nicht mehr nutzen könnt, aber probiert übers Wochenende doch unseres aus“, und möglicherweise war die Veröffentlichung eigentlich erst für nächste Woche geplant, weshalb die Benchmarks noch nicht komplett fertig scheinen

  • Ich hoffe auf die Veröffentlichung von 5.2 flash
    Es ist schon etwas her, aber 4.7 flash fühlt sich für mich immer noch wie eines der stärksten lokalen Coding-Modelle an

    • Ich glaube, ich habe irgendwo gelesen, dass es kein flash geben wird
    • Echt? 4.7-flash war für mich ziemlich schrecklich
      Bei lokalen Modellen ist Qwen-3.5 weiterhin das Beste
      3.6 geht beim VRAM-Verbrauch leicht über 24 GB hinaus, und ab da nutzt man im Grunde keine Consumer-GPU mehr
  • Ich hätte gern einen Blogpost, der die Fähigkeiten des neuen Modells behandelt: was man erwarten kann, ob es günstiger ist, schneller ist, ob die Ausgabequalität besser ist usw.
    Trotzdem danke für die Veröffentlichung

    • Wahrscheinlich sollte man bis Montag abwarten
  • Mich würde interessieren, wie viel Rechenressourcen tatsächlich nötig sind und welche Anforderungen die verschiedenen Varianten haben
    Ich würde auch gern wissen, ob Optimierungen von Google wie TurboQuant, MTP oder eigene Innovationen enthalten sind, die Frontier-Qualität für lokale Nutzer realistisch verfügbar machen

    • Die GLM-5-Serie ist 744B-A40B
      Im vernünftigen Sinn ist das kein lokales Modell, aber da es ein offenes Modell ist, werden wohl in etwa einer Woche, wenn die Gewichte verfügbar sind, mehrere Drittanbieter für Inferenz auftauchen, die beim Preis pro Token konkurrieren
    • Wenn man 80.000 Dollar für Hardware ausgibt, kann man es betreiben
      Es gibt keine lokalen Modelle, die auf Consumer-Hardware effektiv laufen, und wer etwas anderes behauptet, lügt oder lebt in einer Wahnvorstellung