ZCode: Offizielles Harness für GLM-5.2
(zcode.z.ai)- ZCode ist das offizielle Harness für GLM-5.2, das Entwicklungswerkzeuge und AI-Agenten bündelt, um Planung, Codierung, Review und Deployment in einem durchgängigen Ablauf zu erledigen
- ZCode 3.0 stellt die Optimierung für GLM-5.2 und verbesserte Multi-Agenten-Zusammenarbeit in den Vordergrund und betont die Integration mit GLM über den gesamten Bereich von Inferenz- und Coding-Aufgaben hinweg
- Die Beispielaufgabe erstellt ein browserbasiertes Gomoku-AI-Spiel neu und besteht nach dem Anlegen von
index.html,app.jsundstyles.cssauch die Prüfung mitnode --check app.js - Die Preispläne werden mit Lite 16,2 $/Monat, Pro 64,8 $/Monat und Max 144 $/Monat angegeben; endgültige Preise und Leistungen sollten auf z.ai geprüft werden
- Es werden Installationsdateien für macOS, Windows und Linux angeboten; Linux ist als Beta gekennzeichnet und umfasst x64- und ARM64-
.deb-Pakete sowie AppImage
Entwicklungs-Harness für GLM-5.2
- ZCode ist ein Tool, das AI-Agenten und bestehende Entwicklungswerkzeuge kombiniert, damit Planung, Codierung, Review und Deployment nahtloser ablaufen
- Die Produktpositionierung lautet „Simple, Fast, Vibe‑Ready“ und es wird als offizielles Harness für GLM-5.2 vorgestellt
- ZCode 3.0 wurde für GLM-5.2 optimiert und hebt Verbesserungen bei der Multi-Agenten-Zusammenarbeit als zentrale Änderung hervor
Beispiel für den Arbeitsablauf
- Zur Liste der Beispielaufgaben gehören
gomoku-ai,zcode-website,zcode-desktopundrelease-bot gomoku-aiist die Aufgabe, ein intelligentes Gomoku-Spiel zu erstellen- Der Spieler tritt gegen einen smarten Algorithmus an
- Ziel ist eine Funktion, die strategische Züge setzt und Gewinnbedingungen präzise erkennt
- Im Arbeitsprotokoll ist das vorhandene Repository leer oder fast leer, daher verläuft der Prozess als Neuerstellung der App von Grund auf
- Die Ausführung von
git status --shortliefert den Fehler zurück, dass das aktuelle Verzeichnis kein Git-Repository ist - Anschließend werden die Dateien
index.html,app.jsundstyles.csserstellt
- Die Ausführung von
Ergebnis der Gomoku-Implementierung
- Das fertige Beispiel ist ein eigenständiges browserbasiertes Gomoku-Spiel
- Rendert ein 15×15-Brett
- Der Spieler kann schwarze Steine setzen
- Erkennt Siege in vier Richtungen
- Hebt die Gewinnlinie hervor
- Verfolgt Zugreihenfolge und Anzahl der Züge
- Unterstützt einen Neustart des Spiels
- Die AI wählt ihre Züge nicht zufällig, sondern heuristisch
- Sie durchsucht benachbarte Kandidatenzüge
- Sie bewertet offensive Muster, die ihr selbst nutzen
- Sie bewertet defensive Züge zum Blockieren von Bedrohungen des Spielers
- Sie berücksichtigt eine Präferenz für die Brettmitte
- Sie wählt den stärksten Zug aus
- Optional lässt sich ein Overlay für den AI focus area aktivieren, um starke Kandidatenpositionen zu sehen, die die AI berücksichtigt hat
- In der Verifizierungsphase wird
node --check app.jserfolgreich bestanden - Eine interaktive Ausführung im Browser wurde nicht durchgeführt; der verbleibende Schritt besteht darin,
index.htmlim Browser zu öffnen und zu spielen
Lang laufende Aufgaben und externe Steuerung
- ZCode bietet für lang laufende Aufgaben die Funktion Goals
- Sie verwaltet bei komplexen Aufgaben die fortlaufende Planung, Ausführung und Verifizierung
- Mit der Funktion Bot control lässt sich ZCode über WeChat, Feishu und Telegram starten und steuern
- Die Integration mit GLM-5.2 ist über Inferenz, Coding und Multi-Agenten-Zusammenarbeit hinweg optimiert
Preispläne und Downloads
- GLM Coding Plan führt drei Preispläne auf
- Lite: für leichte Aufgaben, 16,2 $/Monat, inklusive Grundkontingent
- Pro: für professionelle Aufgaben, 64,8 $/Monat, inklusive des Fünffachen des Lite-Kontingents
- Max: für Aufgaben mit hohem Nutzungsvolumen, 144 $/Monat, inklusive des Zwanzigfachen des Lite-Kontingents
- Preise und Leistungen der Pläne können sich ändern; die endgültigen Details sollten auf z.ai geprüft werden
- All Downloads bietet Installationsdateien für die jeweiligen Plattformen
- macOS: Apple Silicon
.dmgv3.2.2, Intel.dmgv3.2.2 - Windows: 64-bit
.exev3.2.2, ARM64.exev3.2.2 - Linux: als Beta gekennzeichnetes x64-
.deb, x64 AppImage, ARM64-.deb, ARM64 AppImage v3.2.2
- macOS: Apple Silicon
1 Kommentare
Meinungen auf Hacker News
Ich war etwas überrascht, dass es offenbar nicht Open Source ist. Der Vergleich mit Mimo Code https://github.com/XiaomiMiMo/MiMo-Code liegt nahe. Der Unterschied ist, dass Mimo eine CLI ist und dies hier eine Desktop-App
--dangerously-skip-permissionsanhängen. Selbst ohne dieses Flag würde ich ihr auf meinem Desktop/Laptop nicht vertrauenMeine Vermutung ist, dass man durch viel String-Ersetzung schnell wie ein First-Party-Provider wirken wollte. Trotzdem hätte man opencode auch wieder als generischen Provider hinzufügen können
Ich denke, der Harness wird schnell zu einem Kernbestandteil des „Modells“ selbst. Es ist überhaupt nicht ungewöhnlich, dass ein Unternehmen, das darin eine Umsatzchance sieht, den Harness geschlossen hält
Z.ai hat Integrationen mit fast allen beliebten CLI-basierten Agenten dokumentiert: https://docs.z.ai/devpack/tool/others
Wenn man bereits mit Terminal-UI-Coding-Agenten vertraut ist, braucht man keinen Desktop-Agenten. Für Leute, die den UI-Ansatz der Codex App/Claude App bevorzugen, ist es aber gut, dass es ihn gibt
Sieht ziemlich hübsch aus. Ich bin mir nicht sicher, ob ich es statt OpenCode ausprobieren möchte. OpenCode hat ebenfalls eine Desktop-App, und persönlich gefällt mir deren Terminal-UI besser. Ehrlich gesagt finde ich sie sogar besser als die Terminal-UI von Claude Code. Die Desktop-Version ist einfacher, aber völlig in Ordnung: https://opencode.ai/download
Interessant ist allerdings, dass sie auf einmal eine ganze Menge Dinge veröffentlichen, die von https://chat.z.ai/ verlinkt sind, etwa ZCode, OCR.z.ai, Image.z.ai, Audio.z.ai, AutoClaw und mehr. Für eine einzelne Organisation ist das eine beachtliche Menge
Ich habe auch den Pro-Coding-Plan ausprobiert; gemessen an der Zahl der Tokens, die man braucht, um eine bestimmte Aufgabe abzuschließen, wirkt das Kontingent nicht dramatisch größer als bei Opus. GLM 5.2 selbst ist aber recht ordentlich, etwa wie ein stärkeres Sonnet-Modell
Es ist beeindruckend, wie Unternehmen damit durchkommen, Formulierungen wie „inklusive Basisnutzung“ [1] oder „Standardlimits“ [2] zu verwenden, während höhere Pläne als Vielfache dieser „Basis“ aufgebaut sind, ohne offenzulegen, was der Basiswert eigentlich ist
Der Basiswert scheint sich nach der Marge in diesem Monat zu richten
[1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
[2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...
Start plan: 5 Mio. Tokens pro Tag (GLM-5.2 3 Mio., GLM-5 Turbo 2 Mio.)
For individuals: Kontingent +150 %, ab 18,00 USD, dediziertes Coding-Plan-Kontingent für einzelne Entwickler
Als jemand, der GPT-5.5/Codex täglich nutzt, frage ich mich, wie GLM-5.2/ZCode im Vergleich in einer Codebasis abschneidet, die bereits für agentisches Coding eingerichtet ist
Das vergleicht nur die API-Preise. Nimmt man die Abo-Angebote von Anthropic und OpenAI hinzu, ist es kein Vergleich mehr. Mit einem Codex-Abo für 200 $ kann man bei GPT 5.5 high/xhigh problemlos auch eine Milliarde Tokens pro Woche verbrauchen
Als leistungsstärkstes Open-Weights-Modell ist es interessant, aber im aktuellen Markt scheint es keinen klaren Platz zu haben
Trotzdem ist es deutlich günstiger und für mich brauchbar. Ich habe zwar mehr Erfahrung mit Claude, würde es aber ungefähr auf dem Niveau von Opus 4.1 sehen
Aus UI-Sicht wirkt es viel näher an Codex als an Claude Code. Im Grunde ist es eine exakte Kopie von Codex
Ich frage mich, ob jemand ein anbieterneutrales Terminal-UI oder Harness nutzt, mit dem man den Anbieter für Entwicklungsarbeit nahezu nahtlos wechseln kann
Ich möchte einen lokalen Kontext nach dem Muster: „Hier sind drei AI-Anbieter, nimm diesen fürs Coding, diesen fürs Schreiben von Prosa und diesen für die Bilderzeugung“
OpenCode war das erste Agent-Harness, das ich verwendet habe, und ich mag es weiterhin. Man kann verschiedene Anbieter konfigurieren, es ist Open Source und hat mehrere wichtige Contributors
Eine weitere Option ist Pi (das Pi-Agent-Harness). Es ist eine hervorragende leichtgewichtige Option und unterstützt mehrere Anbieter. Man kann auch lokale Modellserver verwenden
Ich glaube, vielen ist nicht klar, wie viel angenehmer das ist. Claude Code und Codex setzen meiner Ansicht nach vollständig auf Vendor-Lock-in
https://github.com/try-works/role-model
Ich nutze seit Monaten nur noch Pi und erweitere es auch: https://a.l3x.in/ai. Hauptsächlich verwende ich GLM-4.7, danach 5.1 und jetzt 5.2, und mir fehlt kaum noch etwas
Ich feile noch an einem Workflow auf Basis von „Github/Forgejo first“, bin aber schon ziemlich zufrieden. Die meisten Sessions laufen als CI/CD-Jobs und werden durch
"/pi"-Kommentare ausgelöst, um PRs zu erstellen oder Commits in PRs zu pushen: https://github.com/shaftoe/pi-coding-agent-actionDa der Orchestrator weiß, welcher AI-Client in welchem Worktree läuft, ist es recht einfach festzulegen, welche Aufgabe an welche AI gehen soll
In jedem Worktree-Tab läuft Claude oder Codex. Es gibt auch ein paar Anweisungen je nach AI-Terminal-UI; zum Beispiel ist Codex beim Monitoring im Vergleich zu Claude Code recht primitiv, daher habe ich den Codex-Workern zusätzlich notiert, wie sie neue „Mails“ korrekt überwachen sollen
Während ich mit dem Orchestrator im primären Worktree arbeite, delegiert er Aufgaben an die Worker und lässt sie kleine Fragen beantworten. Er zieht Ergebnisse zusammen und hilft bei Bedarf auch beim Aufräumen des Kontexts
Orchestrator und Worker kommunizieren über ein einfaches gemeinsam genutztes Dateisystem unter
tmp/*und können zusammen große, vielfältige Arbeitslasten bearbeitenDa ich iTerm2 nutze, habe ich außerdem iTerm2-spezifisches Python hinzugefügt, mit dem der Orchestrator Worker „aufwecken“ oder vom Terminal-UI blockierte Aktionen wie
/clearausführen lassen kann, indem er Eingaben bearbeitet und abschicktIch mag chinesische Open-Weight-Modelle, die günstige Tokens bieten, nutze sie aber nur für persönliche Projekte
China hat eine Vorgeschichte beim Diebstahl von geistigem Eigentum und Geschäftsgeheimnissen, und chinesische Gerichte haben heimische Unternehmen bevorzugt. Die USA dagegen haben starke Gerichte, über die sich Rechte an geistigem Eigentum durchsetzen lassen. Wenn man das geistige Eigentum, Geschäftsgeheimnisse und Daten des Unternehmens für ein paar billige Tokens riskieren will, kann man Z.ai-Dienste verwenden
Die Trennung von Modell und Werkzeug ist so wichtig wie die Trennung von Legislative und Judikative. Tools oder Harnesses, die nicht wirklich Open Source sind, sollte man einfach ignorieren. Solche Dinge schleichen sich nach und nach ins Leben ein und schnüren einem mit Vendor-Lock-in die Luft ab
Ich halte chinesische Agentensysteme mit proprietärem Quellcode für schwer vertrauenswürdig.
Im Grunde sind sie eine Blackbox mit vollständigen Benutzerrechten; damit übergibt man sein gesamtes System an Server in chinesischem Besitz. Wenn man OpenCode und den GLM-Provider nutzt, kann man zumindest überwachen, welche Dateien gelesen, welche Dateien bearbeitet und welche Befehle ausgeführt wurden.
Außerdem verpflichtet das chinesische Staatssicherheitsgesetz Unternehmen gesetzlich dazu, mit staatlichen Nachrichtendiensten und bei Spionageabwehr-Aktivitäten zusammenzuarbeiten [0]. Wenn man so etwas auf Firmen-Workstations installiert hat und das Unternehmen groß genug ist, ist Überwachung nicht nur ein Risiko, sondern nahezu Gewissheit.
[0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...
Du stellst es so dar, als seien US-Geheimdienste die Guten, aber zumindest für mich ist das überhaupt nicht so.
Allerdings rate ich dringend davon ab, irgendeinen Agenten auf Bare Metal auszuführen, egal in welchem Land das Unternehmen sitzt. In meinem Paper behandle ich diesen Punkt direkt und wiederholt.
Kürzlich fragte mich jemand vorwurfsvoll, warum ich Software mit nur wenigen Sternen ausführe; zu dieser Art Logik habe ich nicht viel zu sagen. Ich habe Systeme entworfen und gebaut, die Zehntausende Nutzer verarbeitet haben. Ich mache hier keine Spielchen. Die Art, wie ich Dinge baue, ist nicht gewöhnlich, und ich empfehle auch niemandem, sie nachzuahmen, aber sie funktioniert für mich und passt zu meiner Denkweise beim Umgang mit komplexen Systemen.
Es steht dir frei, es zu nutzen oder nicht; aber wenn du ohne solide Grundlage Streit suchst, solltest du auch mit Gegenwehr rechnen. Ich habe in meiner Laufbahn viele Fehler gemacht, und Verantwortung zu übernehmen halte ich für wichtig, um zu wachsen. Wenn jemand mit stichhaltiger und substanzieller Kritik kommt, arbeite ich gerne mit ihm daran, meinen Code zu nutzen.