ZCode: Offizielles Harness für GLM-5.2

(zcode.z.ai)

1 Punkte von GN⁺ 5 시간 전 | 1 Kommentare | Auf WhatsApp teilen

ZCode ist das offizielle Harness für GLM-5.2, das Entwicklungswerkzeuge und AI-Agenten bündelt, um Planung, Codierung, Review und Deployment in einem durchgängigen Ablauf zu erledigen
ZCode 3.0 stellt die Optimierung für GLM-5.2 und verbesserte Multi-Agenten-Zusammenarbeit in den Vordergrund und betont die Integration mit GLM über den gesamten Bereich von Inferenz- und Coding-Aufgaben hinweg
Die Beispielaufgabe erstellt ein browserbasiertes Gomoku-AI-Spiel neu und besteht nach dem Anlegen von index.html, app.js und styles.css auch die Prüfung mit node --check app.js
Die Preispläne werden mit Lite 16,2 $/Monat, Pro 64,8 $/Monat und Max 144 $/Monat angegeben; endgültige Preise und Leistungen sollten auf z.ai geprüft werden
Es werden Installationsdateien für macOS, Windows und Linux angeboten; Linux ist als Beta gekennzeichnet und umfasst x64- und ARM64-.deb-Pakete sowie AppImage

Entwicklungs-Harness für GLM-5.2

ZCode ist ein Tool, das AI-Agenten und bestehende Entwicklungswerkzeuge kombiniert, damit Planung, Codierung, Review und Deployment nahtloser ablaufen
Die Produktpositionierung lautet „Simple, Fast, Vibe‑Ready“ und es wird als offizielles Harness für GLM-5.2 vorgestellt
ZCode 3.0 wurde für GLM-5.2 optimiert und hebt Verbesserungen bei der Multi-Agenten-Zusammenarbeit als zentrale Änderung hervor

Beispiel für den Arbeitsablauf

Zur Liste der Beispielaufgaben gehören gomoku-ai, zcode-website, zcode-desktop und release-bot
gomoku-ai ist die Aufgabe, ein intelligentes Gomoku-Spiel zu erstellen
- Der Spieler tritt gegen einen smarten Algorithmus an
- Ziel ist eine Funktion, die strategische Züge setzt und Gewinnbedingungen präzise erkennt
Im Arbeitsprotokoll ist das vorhandene Repository leer oder fast leer, daher verläuft der Prozess als Neuerstellung der App von Grund auf
- Die Ausführung von git status --short liefert den Fehler zurück, dass das aktuelle Verzeichnis kein Git-Repository ist
- Anschließend werden die Dateien index.html, app.js und styles.css erstellt

Ergebnis der Gomoku-Implementierung

Das fertige Beispiel ist ein eigenständiges browserbasiertes Gomoku-Spiel
- Rendert ein 15×15-Brett
- Der Spieler kann schwarze Steine setzen
- Erkennt Siege in vier Richtungen
- Hebt die Gewinnlinie hervor
- Verfolgt Zugreihenfolge und Anzahl der Züge
- Unterstützt einen Neustart des Spiels
Die AI wählt ihre Züge nicht zufällig, sondern heuristisch
- Sie durchsucht benachbarte Kandidatenzüge
- Sie bewertet offensive Muster, die ihr selbst nutzen
- Sie bewertet defensive Züge zum Blockieren von Bedrohungen des Spielers
- Sie berücksichtigt eine Präferenz für die Brettmitte
- Sie wählt den stärksten Zug aus
Optional lässt sich ein Overlay für den AI focus area aktivieren, um starke Kandidatenpositionen zu sehen, die die AI berücksichtigt hat
In der Verifizierungsphase wird node --check app.js erfolgreich bestanden
Eine interaktive Ausführung im Browser wurde nicht durchgeführt; der verbleibende Schritt besteht darin, index.html im Browser zu öffnen und zu spielen

Lang laufende Aufgaben und externe Steuerung

ZCode bietet für lang laufende Aufgaben die Funktion Goals
- Sie verwaltet bei komplexen Aufgaben die fortlaufende Planung, Ausführung und Verifizierung
Mit der Funktion Bot control lässt sich ZCode über WeChat, Feishu und Telegram starten und steuern
Die Integration mit GLM-5.2 ist über Inferenz, Coding und Multi-Agenten-Zusammenarbeit hinweg optimiert

Preispläne und Downloads

GLM Coding Plan führt drei Preispläne auf
- Lite: für leichte Aufgaben, 16,2 $/Monat, inklusive Grundkontingent
- Pro: für professionelle Aufgaben, 64,8 $/Monat, inklusive des Fünffachen des Lite-Kontingents
- Max: für Aufgaben mit hohem Nutzungsvolumen, 144 $/Monat, inklusive des Zwanzigfachen des Lite-Kontingents
Preise und Leistungen der Pläne können sich ändern; die endgültigen Details sollten auf z.ai geprüft werden
All Downloads bietet Installationsdateien für die jeweiligen Plattformen
- macOS: Apple Silicon .dmg v3.2.2, Intel .dmg v3.2.2
- Windows: 64-bit .exe v3.2.2, ARM64 .exe v3.2.2
- Linux: als Beta gekennzeichnetes x64-.deb, x64 AppImage, ARM64-.deb, ARM64 AppImage v3.2.2

1 Kommentare

GN⁺ 5 시간 전

Meinungen auf Hacker News

Ich war etwas überrascht, dass es offenbar nicht Open Source ist. Der Vergleich mit Mimo Code https://github.com/XiaomiMiMo/MiMo-Code liegt nahe. Der Unterschied ist, dass Mimo eine CLI ist und dies hier eine Desktop-App
- Ich weiß auch nicht, was ich mit einer Desktop-App anfangen soll. Solche Dinge lasse ich in einer headless VM laufen und kann bei Bedarf Optionen wie --dangerously-skip-permissions anhängen. Selbst ohne dieses Flag würde ich ihr auf meinem Desktop/Laptop nicht vertrauen
- Dass es eine CLI ist, liegt daran, dass der opencode-Desktop-Code herausgelöst wurde. Auch die Go/Zen-Modellanbieter von opencode wurden entfernt
  Meine Vermutung ist, dass man durch viel String-Ersetzung schnell wie ein First-Party-Provider wirken wollte. Trotzdem hätte man opencode auch wieder als generischen Provider hinzufügen können
- So überraschend ist das wohl nicht. Der Harness wird fast so wichtig wie das Basismodell. Es gab sogar Fälle, in denen allein der Harness Benchmark-Ergebnisse fast verdoppelt hat
  Ich denke, der Harness wird schnell zu einem Kernbestandteil des „Modells“ selbst. Es ist überhaupt nicht ungewöhnlich, dass ein Unternehmen, das darin eine Umsatzchance sieht, den Harness geschlossen hält
- Möglicherweise schicken sie manche Nutzeranfragen an Anthropic, um Transaktionsdaten für ihr eigenes Modell zu sammeln. Dann müssten sie eventuell Request-Tracker einbauen, die sie lieber verbergen möchten
- Wenn Anthropic starke Bedenken wegen Claude-Distillation äußert und man zudem glaubt, dass der Harness der Burggraben ist, ist es nicht besonders überraschend, dass die andere Seite nicht offenlegen will, wie gut sie ist und welchen Ansatz sie verfolgt
Z.ai hat Integrationen mit fast allen beliebten CLI-basierten Agenten dokumentiert: https://docs.z.ai/devpack/tool/others
Wenn man bereits mit Terminal-UI-Coding-Agenten vertraut ist, braucht man keinen Desktop-Agenten. Für Leute, die den UI-Ansatz der Codex App/Claude App bevorzugen, ist es aber gut, dass es ihn gibt
- Der Anreiz dürften hier eher mehr Tokens sein. Soweit ich mich erinnere, waren die Limits großzügiger, wenn man den eigenen Harness nutzt
- Ich nutze GLM 5.2 in OpenCode und lasse CodeNomad innerhalb eines Docker-Containers mit einer webbasierten GUI laufen. Es ist von überall erreichbar, und abgesehen vom Anthropic-Abo-Modell laufen alle Modelle gut
- Dass das Z.ai-Team von Tag eins an Linux-Support eingebaut hat, verdient Lob
Sieht ziemlich hübsch aus. Ich bin mir nicht sicher, ob ich es statt OpenCode ausprobieren möchte. OpenCode hat ebenfalls eine Desktop-App, und persönlich gefällt mir deren Terminal-UI besser. Ehrlich gesagt finde ich sie sogar besser als die Terminal-UI von Claude Code. Die Desktop-Version ist einfacher, aber völlig in Ordnung: https://opencode.ai/download
Interessant ist allerdings, dass sie auf einmal eine ganze Menge Dinge veröffentlichen, die von https://chat.z.ai/ verlinkt sind, etwa ZCode, OCR.z.ai, Image.z.ai, Audio.z.ai, AutoClaw und mehr. Für eine einzelne Organisation ist das eine beachtliche Menge
Ich habe auch den Pro-Coding-Plan ausprobiert; gemessen an der Zahl der Tokens, die man braucht, um eine bestimmte Aufgabe abzuschließen, wirkt das Kontingent nicht dramatisch größer als bei Opus. GLM 5.2 selbst ist aber recht ordentlich, etwa wie ein stärkeres Sonnet-Modell
- Deren Terminal-UI ist im Vergleich zu Claude Code ziemlich schwerfällig und stürzt häufig ab
Es ist beeindruckend, wie Unternehmen damit durchkommen, Formulierungen wie „inklusive Basisnutzung“ [1] oder „Standardlimits“ [2] zu verwenden, während höhere Pläne als Vielfache dieser „Basis“ aufgebaut sind, ohne offenzulegen, was der Basiswert eigentlich ist
Der Basiswert scheint sich nach der Marge in diesem Monat zu richten
[1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
[2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...
- Wenn man die App startet, wird die tatsächliche Basisnutzung angezeigt. Allerdings unterscheiden sich die Plannamen von denen auf der Webseite
  Start plan: 5 Mio. Tokens pro Tag (GLM-5.2 3 Mio., GLM-5 Turbo 2 Mio.)
  For individuals: Kontingent +150 %, ab 18,00 USD, dediziertes Coding-Plan-Kontingent für einzelne Entwickler
- Das ist wirklich schlecht. Wir versuchen, so transparent wie möglich zu sein, und haben es hier veröffentlicht: https://synthetic.new/rate-limits
- Deshalb mag ich die australische ACCC. Wäre es ein australisches Unternehmen, hätte man es damit nicht einfach durchkommen lassen
- Das ist eine Strategie, die nach hinten losgehen kann. Ein unberechenbares Tool ist schlechter als ein schlechtes Tool
Als jemand, der GPT-5.5/Codex täglich nutzt, frage ich mich, wie GLM-5.2/ZCode im Vergleich in einer Codebasis abschneidet, die bereits für agentisches Coding eingerichtet ist
- GLM 5.2 sitzt in einem ungünstigen Niemandsland. Zu groß, um es zu Hause laufen zu lassen, und im Vergleich zu Modellen mit ähnlicher Leistung teuer und langsam. Eine gute Grafik gibt es hier: https://deepswe.datacurve.ai/
  Das vergleicht nur die API-Preise. Nimmt man die Abo-Angebote von Anthropic und OpenAI hinzu, ist es kein Vergleich mehr. Mit einem Codex-Abo für 200 $ kann man bei GPT 5.5 high/xhigh problemlos auch eine Milliarde Tokens pro Woche verbrauchen
  Als leistungsstärkstes Open-Weights-Modell ist es interessant, aber im aktuellen Markt scheint es keinen klaren Platz zu haben
- Kurz gesagt: GLM wird Aufgaben deutlich länger dauern lassen und je nach Komplexität möglicherweise auch mehr Tokens verbrauchen
  Trotzdem ist es deutlich günstiger und für mich brauchbar. Ich habe zwar mehr Erfahrung mit Claude, würde es aber ungefähr auf dem Niveau von Opus 4.1 sehen
Aus UI-Sicht wirkt es viel näher an Codex als an Claude Code. Im Grunde ist es eine exakte Kopie von Codex
- Stimme voll zu. Das Hand-Icon, die Nutzung des Textfelds und auch der Sidebar-Stil sind 1:1 identisch mit Codex. Der Titel ist irreführend. Es ist nicht nah an Claude Code
- Deshalb wirkt es noch lächerlicher, Codex geschlossen zu halten. Software ist längst kein Burggraben mehr. Man kann sie einfach freigeben
Ich frage mich, ob jemand ein anbieterneutrales Terminal-UI oder Harness nutzt, mit dem man den Anbieter für Entwicklungsarbeit nahezu nahtlos wechseln kann
Ich möchte einen lokalen Kontext nach dem Muster: „Hier sind drei AI-Anbieter, nimm diesen fürs Coding, diesen fürs Schreiben von Prosa und diesen für die Bilderzeugung“
- https://opencode.ai/
  OpenCode war das erste Agent-Harness, das ich verwendet habe, und ich mag es weiterhin. Man kann verschiedene Anbieter konfigurieren, es ist Open Source und hat mehrere wichtige Contributors
  Eine weitere Option ist Pi (das Pi-Agent-Harness). Es ist eine hervorragende leichtgewichtige Option und unterstützt mehrere Anbieter. Man kann auch lokale Modellserver verwenden
- Ich habe in den letzten sechs Monaten sowohl Pi als auch OpenCode genutzt und im selben Zeitraum die proprietären Harnesses Claude Code, Codex und Cursor nicht einmal geöffnet. Derzeit nutze ich Pi und kann mitten in einer Session nahtlos zu jedem Modell eines beliebigen Anbieters wechseln. Ich kann es auch auf ein lokal laufendes Modell zeigen lassen
  Ich glaube, vielen ist nicht klar, wie viel angenehmer das ist. Claude Code und Codex setzen meiner Ansicht nach vollständig auf Vendor-Lock-in
- Das geht mit role-model, einem Modell-Router, den ich gebaut habe. Er routet anhand von Rollen, Aufgaben usw. Es gibt eine Erweiterung für Pi, damit der Coding-Agent Request-Metadaten wie Rolle und Fähigkeiten angeben kann
  https://github.com/try-works/role-model
- Falls du es noch nicht ausprobiert hast, lohnt sich ein Blick auf https://pi.dev
  Ich nutze seit Monaten nur noch Pi und erweitere es auch: https://a.l3x.in/ai. Hauptsächlich verwende ich GLM-4.7, danach 5.1 und jetzt 5.2, und mir fehlt kaum noch etwas
  Ich feile noch an einem Workflow auf Basis von „Github/Forgejo first“, bin aber schon ziemlich zufrieden. Die meisten Sessions laufen als CI/CD-Jobs und werden durch "/pi"-Kommentare ausgelöst, um PRs zu erstellen oder Commits in PRs zu pushen: https://github.com/shaftoe/pi-coding-agent-action
- Ich habe einen Skill für Codex und Claude Code geschrieben. Dabei wird im primären Worktree ein Orchestrator festgelegt, während es egal ist, welche Art von AI-Worker in N zusätzlichen Worktrees läuft
  Da der Orchestrator weiß, welcher AI-Client in welchem Worktree läuft, ist es recht einfach festzulegen, welche Aufgabe an welche AI gehen soll
  In jedem Worktree-Tab läuft Claude oder Codex. Es gibt auch ein paar Anweisungen je nach AI-Terminal-UI; zum Beispiel ist Codex beim Monitoring im Vergleich zu Claude Code recht primitiv, daher habe ich den Codex-Workern zusätzlich notiert, wie sie neue „Mails“ korrekt überwachen sollen
  Während ich mit dem Orchestrator im primären Worktree arbeite, delegiert er Aufgaben an die Worker und lässt sie kleine Fragen beantworten. Er zieht Ergebnisse zusammen und hilft bei Bedarf auch beim Aufräumen des Kontexts
  Orchestrator und Worker kommunizieren über ein einfaches gemeinsam genutztes Dateisystem unter tmp/* und können zusammen große, vielfältige Arbeitslasten bearbeiten
  Da ich iTerm2 nutze, habe ich außerdem iTerm2-spezifisches Python hinzugefügt, mit dem der Orchestrator Worker „aufwecken“ oder vom Terminal-UI blockierte Aktionen wie /clear ausführen lassen kann, indem er Eingaben bearbeitet und abschickt
Ich mag chinesische Open-Weight-Modelle, die günstige Tokens bieten, nutze sie aber nur für persönliche Projekte
China hat eine Vorgeschichte beim Diebstahl von geistigem Eigentum und Geschäftsgeheimnissen, und chinesische Gerichte haben heimische Unternehmen bevorzugt. Die USA dagegen haben starke Gerichte, über die sich Rechte an geistigem Eigentum durchsetzen lassen. Wenn man das geistige Eigentum, Geschäftsgeheimnisse und Daten des Unternehmens für ein paar billige Tokens riskieren will, kann man Z.ai-Dienste verwenden
- Zur Einordnung: Z.AI-Modelle lassen sich auch auf nicht-chinesischer Infrastruktur nutzen
- Für die USA gilt dasselbe
Die Trennung von Modell und Werkzeug ist so wichtig wie die Trennung von Legislative und Judikative. Tools oder Harnesses, die nicht wirklich Open Source sind, sollte man einfach ignorieren. Solche Dinge schleichen sich nach und nach ins Leben ein und schnüren einem mit Vendor-Lock-in die Luft ab
Ich halte chinesische Agentensysteme mit proprietärem Quellcode für schwer vertrauenswürdig.
Im Grunde sind sie eine Blackbox mit vollständigen Benutzerrechten; damit übergibt man sein gesamtes System an Server in chinesischem Besitz. Wenn man OpenCode und den GLM-Provider nutzt, kann man zumindest überwachen, welche Dateien gelesen, welche Dateien bearbeitet und welche Befehle ausgeführt wurden.
Außerdem verpflichtet das chinesische Staatssicherheitsgesetz Unternehmen gesetzlich dazu, mit staatlichen Nachrichtendiensten und bei Spionageabwehr-Aktivitäten zusammenzuarbeiten [0]. Wenn man so etwas auf Firmen-Workstations installiert hat und das Unternehmen groß genug ist, ist Überwachung nicht nur ein Risiko, sondern nahezu Gewissheit.
[0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...
- Stimme zu. US-Konkurrenten sind genauso schwer vertrauenswürdig. Hier ist Open Source meiner Meinung nach die Antwort.
- Zumindest sind die Modellgewichte öffentlich. Ich bin kein Amerikaner, daher ist diese Seite für mich in jeder möglichen Hinsicht deutlich vertrauenswürdiger.
  Du stellst es so dar, als seien US-Geheimdienste die Guten, aber zumindest für mich ist das überhaupt nicht so.
- Bei US-Anbietern ist es exakt dasselbe.
- Man kann es unter Opencode in einem Container laufen lassen. Es funktioniert sehr gut, und ich habe sogar auf den Pro-Plan upgegradet (ca. 60 $/Monat). Wenn du es in einem Container nutzen willst, findest du Informationen dazu im Projekt in meinem Profil. Der Code ist komplett Open Source, und ich habe ihn gebaut, weil ich ihn für meine eigene Arbeit brauchte. Es gibt sicher zahllose andere Wege.
  Allerdings rate ich dringend davon ab, irgendeinen Agenten auf Bare Metal auszuführen, egal in welchem Land das Unternehmen sitzt. In meinem Paper behandle ich diesen Punkt direkt und wiederholt.
  Kürzlich fragte mich jemand vorwurfsvoll, warum ich Software mit nur wenigen Sternen ausführe; zu dieser Art Logik habe ich nicht viel zu sagen. Ich habe Systeme entworfen und gebaut, die Zehntausende Nutzer verarbeitet haben. Ich mache hier keine Spielchen. Die Art, wie ich Dinge baue, ist nicht gewöhnlich, und ich empfehle auch niemandem, sie nachzuahmen, aber sie funktioniert für mich und passt zu meiner Denkweise beim Umgang mit komplexen Systemen.
  Es steht dir frei, es zu nutzen oder nicht; aber wenn du ohne solide Grundlage Streit suchst, solltest du auch mit Gegenwehr rechnen. Ich habe in meiner Laufbahn viele Fehler gemacht, und Verantwortung zu übernehmen halte ich für wichtig, um zu wachsen. Wenn jemand mit stichhaltiger und substanzieller Kritik kommt, arbeite ich gerne mit ihm daran, meinen Code zu nutzen.
- Deshalb nutze ich Reasonix gern zusammen mit Deepseek. Wenn es im Cache landet, sind Anfragen praktisch kostenlos, und der Weg läuft außerdem über nicht subventionierte US-Anbieter wie Digital Ocean oder Cloudflare.

ZCode: Offizielles Harness für GLM-5.2

Entwicklungs-Harness für GLM-5.2

Beispiel für den Arbeitsablauf

Ergebnis der Gomoku-Implementierung

Lang laufende Aufgaben und externe Steuerung

Preispläne und Downloads

Verwandte Beiträge

1 Kommentare

Meinungen auf Hacker News