Is GLM 5.2 actually open source?

The weights are released under the MIT license, which is one of the most permissive licenses available and allows commercial use, modification, and redistribution. The weights went public on Hugging Face (as zai-org/GLM-5.2 and an FP8 build) on June 16, 2026. Note that "open weights under MIT" is not the same as a fully open-source project with public training data; you get the model, not the recipe.

How much does GLM 5.2 cost to use?

Through the API, expect roughly $1.40 per million input tokens and $4.40 per million output on Zhipu's endpoint, with caching dropping cached input to about $0.26 per million. The subscription GLM Coding Plan is often cheaper for steady use, with promotional tiers starting around $10/month for Lite and scaling to ~$80/month for Max (list prices run higher). Third-party providers such as OpenRouter list comparable per-token rates.

Can I run GLM 5.2 on my own GPU?

Only if "my own GPU" means a multi-GPU server. The ~753B weights need roughly 8x H200 at FP8, or about 4x H200 (or more lower-memory cards) with INT4 quantization, and the 1M-token context adds a large KV-cache requirement on top. A single consumer GPU cannot run this model; for that you want a smaller, purpose-built local model.

Does GLM 5.2 work with Claude Code?

Yes. Zhipu exposes an Anthropic-compatible endpoint, so you point Claude Code at https://api.z.ai/api/anthropic, set the model to glm-5.2[1m], and supply a Z.ai API key. Raising the request timeout is recommended for long planning runs. The same approach works for Cline, OpenCode, OpenClaw, Goose, Roo Code, Crush, and Kilo Code.

How does GLM 5.2's context window compare to GLM 5.1?

It is five times larger: 1,000,000 tokens versus roughly 200,000 in GLM 5.1. The maximum output also stays high at 131,072 tokens, which together make GLM 5.2 better suited to holding an entire codebase plus a long agent transcript in one session.

Did Zhipu publish benchmarks for GLM 5.2?

Not at the June 13 Coding Plan launch — that release focused on availability and the open-weights roadmap. But Zhipu published a full benchmark table when the weights went public on June 16, and independent labs followed: Artificial Analysis rates it the top open-weights model on its Intelligence Index (51), and Code Arena ranks it #2 on frontend coding. Vendor-run agentic scores (SWE-bench Pro 62.1, Terminal-Bench 2.1 of 81.0) should still be sanity-checked against neutral evaluations.

Is GLM 5.2 better than Kimi K2 or DeepSeek for coding?

On independent aggregate intelligence it currently leads them: Artificial Analysis scores GLM 5.2 at 51 versus DeepSeek V4 Pro and Kimi K2.6 in the low-40s, and it tops both on Code Arena's frontend board. On any specific agentic-coding task the gap can close or reverse, and all three publish detailed SWE-bench results, so for a high-stakes decision run a head-to-head on your own repository rather than trusting a single leaderboard.

GLM 5.2 erklärt: Zhipus offenes Coder-Modell mit 1-Mio.-Token-Kontext

Am 13. Juni 2026 stellte Zhipu AI (das seine Produkte mittlerweile unter der Marke Z.ai vermarktet) GLM 5.2 in allen Stufen seines GLM-Coding-Plans vor. Die zentrale Neuerung ist ein Kontextfenster von einer Million Tokens – fünfmal so groß wie bei GLM 5.1 – gepaart mit unter der MIT-Lizenz veröffentlichten offenen Gewichten, die Zhipu innerhalb einer Woche nach der Ankündigung veröffentlichen wollte, zusammen mit einer eigenständigen API und einem Chatbot. Für ein Modell, das gezielt auf langfristige, agentenbasierte Programmieraufgaben ausgelegt ist, ist diese massive Erweiterung des Kontextfensters entscheidend.

Ebenso bemerkenswert war, was in der Launch-Ankündigung fehlte: kein einziger Benchmark-Wert. Weder SWE-bench, noch Terminal-Bench noch ein Wert aus Code Arena wurden genannt. Das ist ungewöhnlich für eine Spitzenmodell-Veröffentlichung; in den ersten Tagen basierten sämtliche Aussagen zur „Leistung“ von GLM 5.2 entweder auf Marketingmaterial des Herstellers oder auf informellen Einschätzungen von Einzelpersonen. Dies änderte sich am 16. Juni, als die offenen Gewichte veröffentlicht wurden: Zhipu veröffentlichte eine umfassende Benchmark-Suite, und unabhängige Evaluatoren folgten rasch. Dieser Artikel behandelt, worum es bei GLM 5.2 tatsächlich geht, welche Spezifikationen Zhipu bestätigt hat, welche Benchmark-Zahlen mittlerweile vorliegen (und wie sehr man ihnen vertrauen kann), wie man auf ein Modell dieser Größe zugreifen oder es selbst hosten kann, wie es sich gegenüber GLM 5.1 und anderen offenen Codierungsmodellen schlägt – und wer sich damit auseinandersetzen sollte.

Wichtigste Erkenntnisse

Veröffentlicht am 13. Juni 2026 im Rahmen des GLM-Coding-Plans; die API, der Chatbot und die unter der MIT-Lizenz offengelegten Gewichte folgten am 16. Juni.
~753-Milliarden-Parameter-Mixture-of-Experts (laut Zhipus eigenem Model Card) mit rund 40 Milliarden aktiven Parametern pro Token, verfügbar in Claude Code unter der Modell-ID glm-5.2[1m] (Basis-ID glm-5.2).
Kontextfenster mit einer Million Tokens (gestiegen von ~200.000 Tokens bei GLM 5.1), wobei die Ausgabe auf 131.072 Tokens begrenzt ist und zwei Denkmodi zur Verfügung stehen: High und Max.
Anthropic-kompatibler Endpunkt bedeutet, dass Claude Code, Cline, OpenCode, OpenClaw und andere darauf zugreifen können, indem lediglich eine Basis-URL angepasst wird.
Benchmark-Ergebnisse liegen nun vor. Sie fehlten bei der Soft-Launch-Veranstaltung am 13. Juni, wurden aber zusammen mit den Gewichten veröffentlicht: vom Hersteller angegebene Werte von SWE-bench Pro 62,1 und Terminal-Bench 2.1 von 81,0 sowie ein unabhängiger Artificial Analysis Intelligence Index-Wert von 51, der GLM 5.2 zum leistungsstärksten Modell mit offenen Gewichten macht. Herstellerangaben sind als solche zu betrachten; die unabhängigen Ergebnisse bestätigen jedoch das allgemeine Bild.
Selbsthosting ist eine Aufgabe für Rechenzentren: ca. 8× H200 im FP8-Format oder weniger GPUs bei aggressiver INT4-Quantisierung – bevor man den KV-Cache für das 1-Million-Tokens-Kontextfenster berücksichtigt.

Was GLM 5.2 tatsächlich ist

GLM 5.2 ist die dritte Veröffentlichung in Zhipus GLM-5-Reihe nach GLM 5 und GLM 5.1 und wurde für eine einzige Aufgabe konzipiert: das Schreiben und die Wartung von Software über lange, mehrstufige Sitzungen hinweg. Es handelt sich um ein sparsames Mixture-of-Experts-(MoE-)Modell mit insgesamt rund 753 Milliarden Parametern, von denen jedoch pro Token nur etwa 40 Milliarden aktiv sind. (Zhipus Model Card auf Hugging Face nennt 753 Milliarden; einige externe Tracker runden diesen Wert auf ~744 Milliarden – denselben Wert wie bei GLM 5.1.) Diese Sparsamkeit ermöglicht es, ein Modell dieser Größe mit brauchbarer Geschwindigkeit und zu vertretbaren Kosten zu betreiben, da die Berechnungskosten sich auf die ~40 Milliarden aktiven Parameter pro Vorwärtspass beziehen – nicht auf die gesamten 753 Milliarden.

Zwei Merkmale unterscheiden die GLM-5.2-Generation von ihrem Vorgänger. Erstens: der Kontext – das Modell akzeptiert bis zu einer Million Eingabetokens. Die eigenständige API bietet standardmäßig die Modell-ID glm-5.2 (mit kürzerem Kontext), während das volle Kontextfenster mit einer Million Tokens über die Variante glm-5.2[1m] adressiert wird – jene Variante, die Sie in Claude Code integrieren. Eine Million Tokens reichen aus, um ein mittelgroßes Repository samt Tests und einem ausführlichen Arbeitsprotokoll in einem einzigen Fenster abzubilden. Zweitens: die Ausgabe – das Modell kann in einer einzigen Antwort bis zu 131.072 Tokens generieren, was dann relevant wird, wenn ein Agent ein komplettes Modul oder einen umfangreichen Refactor-Diff statt nur eines Code-Snippets erzeugt.

Zhipu ersetzte die älteren Voreinstellungen für Denkanstrengung durch zwei neue Stufen: High und Max; für komplexe, mehrstufige Programmieraufgaben empfiehlt Zhipu die Stufe Max. Es gibt keine Optionen Low oder Auto. Falls Sie Hintergrundinformationen zu Zhipus früheren Modellen und zur Entwicklung des Unternehmens suchen, bietet unser Grundlagenartikel zur GLM-Modellreihe von Zhipu einen Überblick über die Modellfamilie.

Die Spezifikationen und die verspätet eingetroffenen Benchmarks

Hier ist der Teil, den es sich lohnt, langsam zu lesen, denn die Lage entwickelte sich rasch. Zhipu stellte GLM 5.2 am 13. Juni im Rahmen des Coding Plan bereit mit keinerlei veröffentlichten Bewertungen jeglicher Art. Medien, die diesen sanften Start berichteten – darunter MarkTechPost – wiesen alle auf dasselbe hin: Die Ankündigung behandelte Verfügbarkeit, Kontextlänge und den Open-Source-Roadmap, erwähnte jedoch nicht, wie das Modell in Benchmarks abschnitt.

Das änderte sich am 16. Juni, als die offenen Gewichte auf Hugging Face veröffentlicht wurden und Zhipu gleichzeitig eine Benchmark-Tabelle dazu veröffentlichte. Der sogenannte „Benchmark-Vakuum“ war also real, doch handelte es sich um eine zeitliche Besonderheit zum Launch-Zeitpunkt – nicht um eine dauerhafte Lücke. Daraus ergeben sich zwei Schlussfolgerungen.

Erstens die vom Hersteller angegebenen Werte. Auf der offiziellen Karte von Zhipu erzielt GLM 5.2 einen SWE-bench-Pro-Wert von 62,1 (gegenüber 58,4 bei GLM 5.1 und 58,6 bei GPT-5.5, allerdings hinter Claude Opus 4.8 mit 69,2) sowie einen Terminal-Bench-2.1-Wert von 81,0 (gegenüber rund 63,5 bei GLM 5.1 und knapp hinter Opus 4.8 mit 85,0 bzw. GPT-5.5 mit 84,0). Bei der FrontierSWE-Long-Horizon-Suite gibt Zhipu an, dass GLM 5.2 Opus 4.8 um etwa einen Punkt hinterherhinkt. Diese Werte stammen vom Hersteller und sind entsprechend zu lesen – günstige Harness-Auswahl ist bei Erstveröffentlichungen üblich.

Zweitens – und hier viel aussagekräftiger – haben mittlerweile unabhängige Evaluatoren Stellung bezogen und bestätigen das Bild weitgehend. Artificial Analysis bewertet GLM 5.2 mit 51 Punkten im Intelligence Index v4.1 und macht es damit zum führenden Open-Weights-Modell, vor MiniMax-M3 (44), DeepSeek V4 Pro (44) und Kimi K2.6 (43). Auf der community-gewählten Code Arena belegt GLM 5.2 (Max) Platz #2 in der Frontend/WebDev-Leaderboard-Rangliste, direkt hinter Claude Fable 5 und deutlich vor anderen Open-Source-Modellen. Eine echte Einschränkung, die die unabhängigen Daten offenbaren: GLM 5.2 verbraucht pro Aufgabe deutlich mehr Ausgabetokens als seine Konkurrenten (Artificial Analysis maß rund 43.000 Tokens pro Intelligence-Index-Aufgabe – gegenüber rund 26.000 bei GLM 5.1), was bei langen Jobs seinen Kostenvorteil schmälert.

Die ehrliche Einordnung heute lautet daher nicht „keine Zahlen – nichts glauben“. Vielmehr: GLM 5.2 ist ein nachgewiesen starkes Open-Weights-Modell auf unabhängigen Intelligenz- und Frontend-Coding-Leaderboards; seine vom Hersteller selbst ermittelten agentic-coding-Werte (SWE-bench Pro, Terminal-Bench) sollten jedoch vor einer endgültigen Bewertung durch einen neutralen Evaluierer wie LiveBench oder eigene Tests überprüft werden – insbesondere bevor man Schlagzeilen wie „schlägt GPT-5.5“ als endgültig betrachtet. Einige dieser Aussagen sind technisch auf bestimmten Benchmarks durchaus begründet – so liegt GLM 5.2 in Zhipus Tabelle tatsächlich knapp vor GPT-5.5 bei SWE-bench Pro – doch verliert es gegenüber Claude Opus 4.8 in nahezu allen gleichen Testkategorien; die Einordnung ist also entscheidend.

Attribut	GLM 5.2 (bestätigt)
Coding-Plan-Launch	13. Juni 2026
API & offene Gewichte	16. Juni 2026
Gesamtanzahl Parameter	~753 Mrd. (MoE; einige Tracker nennen ~744 Mrd.)
Aktiv pro Token	~40 Mrd.
Kontextfenster	1.000.000 Tokens (`glm-5.2[1m]`)
Maximale Ausgabe	131.072 Tokens
Denkmodi	High, Max
Lizenz	MIT-Lizenz (offene Gewichte)
Unabhängiger Benchmark	Artificial Analysis Intelligence Index: 51 (führendes Open-Weights-Modell)

Wie man GLM 5.2 in der Cloud nutzt

Der schnellste Weg ist der GLM Coding Plan – ein Abonnement, das Coding-Agenten über gehostete Endpunkte von Zhipu leitet. Promotions-Stufen zum Launch liegen bei etwa 10 USD/Monat für Lite (ca. 400 Anfragen/Woche), ca. 30 USD/Monat für Pro (~2.000 Anfragen/Woche) und ca. 80 USD/Monat für Max (~8.000 Anfragen/Woche); für Teams gilt sitzbasierte Preisgestaltung. Die regulären (nicht-promotionalen) Listenpreise liegen höher – einige Wiederverkäufer nennen Preise von ca. 18 / 72 / 160 USD – und die Quoten können sich ändern; prüfen Sie daher stets die aktuellen Zahlen auf z.ai vor dem Abschluss eines Abonnements.

Falls Sie lieber pro Token bezahlen möchten, listet die eigenständige API bei Zhipus eigenem Endpunkt etwa 1,40 USD pro Million Eingabetokens und 4,40 USD pro Million Ausgabetokens; Prompt-Caching senkt den Preis für zwischengespeicherte Eingaben auf rund 0,26 USD pro Million und kann die effektiven Kosten bei wiederholtem Kontext deutlich reduzieren. Drittanbieter-Gateways wie OpenRouter bewerben vergleichbare Tarife (Simon Willison testete dies dort ebenfalls mit denselben 1,40 / 4,40 USD), sodass es sich lohnt, bei Kostenentscheidungen verschiedene Wiederverkäufer zu vergleichen.

Der entscheidende Vorteil von GLM 5.2 für bestehende Workflows ist der Anthropic-kompatible Endpunkt. Tools, die bereits mit der Anthropic Messages API kommunizieren, können einfach auf Zhipus Endpunkt umgeleitet werden – lediglich durch Setzen einer Umgebungsvariablen, ohne Codeänderungen:

Einstellung	Wert
`ANTHROPIC_BASE_URL`	`https://api.z.ai/api/anthropic`
Modell (Claude Code, 1 Mio.)	`glm-5.2[1m]`
Coding-Endpunkt (Cline etc.)	`https://api.z.ai/api/coding/paas/v4`
Timeout für lange Aufrufe	Erhöhen `API_TIMEOUT_MS` (z. B. 3.000.000) für Plan-Modus-Ausführungen

Genau dieser einfache Austausch ist der Grund dafür, dass GLM 5.2 bereits am Tag eins Unterstützung für Claude Code, Cline, OpenCode, Roo Code, Goose, Crush, OpenClaw und Kilo Code bot. Falls Sie in einer terminalbasierten Agentenumgebung arbeiten, behandelt unsere Anleitung zu OpenCode und dessen Handhabung verschiedener Model-Backends die technische Integration ausführlicher.

Die Hardware-Realität beim Betrieb eines ~753-Milliarden-Parameter-Modells vor Ort

Die MIT-Lizenz ist das herausragende Merkmal – und sie ist echt: Da die Gewichte nun öffentlich auf Hugging Face zugänglich sind, können Sie GLM 5.2 herunterladen, feinjustieren und selbst hosten – ohne Nutzungs- oder regionale Einschränkungen. Der Haken dabei: „Open“ bedeutet nicht „lässt sich auf Ihrem Laptop ausführen“. Ein Modell mit ~753 Mrd. Parametern ist eine Rechenzentrumsaufgabe.

Bei FP8-Präzision (ungefähr ein Byte pro Parameter) benötigen allein die Gewichte rund 750 GB VRAM – praktisch also etwa 8× H200 (je 141 GB) oder 8× B200. Bei INT4 sinkt der Speicherbedarf auf rund 370 GB, was auf etwa 4× H200 passt – oder alternativ auf mehr, aber speicherschwächere Karten wie 8× H100, allerdings mit einem gewissen Qualitätsverlust. Und diese Zahlen gelten noch ohne Kontext: Ein KV-Cache mit 1 Million Tokens fügt geschätzte weitere 80 GB oder mehr hinzu, sodass die 1-Mio.-Token-Konfiguration realistischerweise H200-/B200-Knoten erfordert. Berichtete Deploy-Anleitungen veranschlagen einen einzelnen 8×-H200-Server bei Spot-Preisen bei etwa 10.000 USD/Monat, bei On-Demand-GPU-Clouds steigen die Kosten auf 25.000 USD oder mehr.

Für die überwiegende Mehrheit der Teams spricht die Rechnung klar für die Nutzung der API. Das Self-Hosting von GLM 5.2 ist nur dann sinnvoll, wenn Data-Residency-Anforderungen, Air-Gapping oder sehr hohe, kontinuierliche Volumina den operativen Aufwand rechtfertigen – und beachten Sie: Die komfortable gehostete API läuft auf chinesischer Infrastruktur, was für manche Käufer eine eigene Abwägung darstellt. Falls Ihr eigentliches Ziel ein Modell ist, das Sie auf Hardware betreiben können, die Ihnen wirklich gehört, ist ein ~753 Mrd. Parameter umfassendes MoE-Modell das falsche Werkzeug; unser Leitfaden zu den besten lokalen LLMs für Programmieraufgaben zeigt Optionen auf, die für einen einzelnen Arbeitsplatzrechner oder einen moderaten GPU-Server ausgelegt sind.

Stärken

Ein Kontext von 1 Million Tokens ist tatsächlich sehr groß und besonders gut geeignet für agentenbasierte Arbeiten über ganze Repositories.
Permissive MIT-Lizenz mit vollständig offenen Gewichten – keine Einschränkung auf Forschungszwecke oder Nichtkommerz-Nutzung.
Unabhängig das führende Open-Weights-Modell im Artificial Analysis Intelligence Index und Platz #2 im Frontend-Leaderboard der Code Arena.
Drop-in-fähiger, Anthropic-kompatibler Endpunkt bedeutet nahezu keinen Migrationsaufwand von Claude-Clients, und die Pricing-Struktur des Coding Plans unterbietet geschlossene Spitzen-APIs für starke Nutzer.

Einschränkungen

Die vom Hersteller ermittelten agentic-coding-Werte (SWE-bench Pro, Terminal-Bench) stammen vom Hersteller und liegen hinter Claude Opus 4.8; bestätigen Sie diese daher mit neutralen Evaluatoren oder eigenen Tests.
Verwendet deutlich mehr Ausgabetokens pro Aufgabe als vergleichbare Modelle, was seinen Kostenvorteil bei langen Aufgaben schmälert.
Selbsthosting erfordert Mehr-GPU-Data-Center-Hardware, nicht Consumer- oder Prosumer-Ausrüstung; die gehostete API läuft auf chinesischer Infrastruktur.
Nur die Stufen „High“ und „Max“ für den Aufwand; es gibt keine günstige, schnelle Variante für triviale Aufgaben. Preisgestaltung und Kontingente befinden sich noch in der Festlegungsphase.

GLM 5.2 im Vergleich zu GLM 5.1 und dem Feld der Modelle mit offenen Gewichten

Im Vergleich zu seinem eigenen Vorgänger GLM 5.2 ist GLM 5.2 etwa gleich groß – Zhipu beschreibt es als derselben Parameterklasse wie GLM 5.1 (~753 Mrd. vs. ~754 Mrd.) – mit derselben MoE-Architektur und etwa 40 Mrd. aktiven Parametern. Der entscheidende Fortschritt liegt nahezu ausschließlich im erweiterten Kontextfenster und der höheren Ausgabegrenze sowie einem messbaren Anstieg der Benchmark-Werte.

Modell	Gesamtanzahl der Parameter	Kontext	Maximale Ausgabe	Lizenz	SWE-bench Pro (Hersteller)
GLM 5.2	~753 Mrd. MoE	1,000,000	131,072	MIT	62.1
GLM 5.1	~754 Mrd. MoE	~200,000	~131.000	MIT	58.4

Im weiteren Wettlauf um offene Gewichte im Bereich Programmierung tritt GLM 5.2 nun als führendes Modell auf mehreren unabhängigen Benchmarks auf – nicht als unerprobter Neuling. Die Kimi-K2-Generation von Moonshot sowie die neuesten Codiermodelle von DeepSeek und Qwen veröffentlichen alle SWE-bench- und agentenbasierte Programmierergebnisse; zudem bietet Qwens Flaggschiff ein Kontextfenster von einer Million Tokens – doch im Artificial Analysis Intelligence Index liegt GLM 5.2 (51) vor DeepSeek V4 Pro (44) und Kimi K2.6 (43). Dennoch bedeutet eine Platzierung in der Rangliste nicht automatisch, dass das Modell optimal für Ihre Codebasis geeignet ist; in hausinternen Agenten-Suiten bleibt GLM 5.2 nach wie vor hinter der geschlossenen Frontier (Claude Opus 4.8) zurück. Für einen Überblick darüber, wie sich die anderen chinesischen Forschungslabore messen, siehe unsere Analyse von DeepSeek V4 versus Qwen 3, und für das Modell, das am häufigsten als Alternative zu GLM 5.2 betrachtet wird, unseren Vergleich von Kimi K2.7 für Programmieraufgaben. Wir haben beide Modelle zudem direkt miteinander verglichen in GLM 5.2 vs. Kimi K2.7 für Programmieraufgaben.

Häufig gestellte Fragen (FAQ)

Ist GLM 5.2 tatsächlich Open Source?

Die Gewichte werden unter der MIT-Lizenz veröffentlicht – einer der permissivsten verfügbaren Lizenzen, die kommerzielle Nutzung, Modifikation und Weiterverbreitung erlaubt. Die Gewichte wurden am 16. Juni 2026 öffentlich auf Hugging Face bereitgestellt (als zai-org/GLM-5.2 sowie in einer FP8-Version). Beachten Sie jedoch, dass „offene Gewichte unter MIT“ nicht dasselbe ist wie ein vollständig open-source-Projekt mit öffentlich zugänglichen Trainingsdaten: Sie erhalten das Modell, nicht das Rezept.

Wie hoch sind die Kosten für die Nutzung von GLM 5.2?

Über die API betragen die Kosten etwa 1,40 USD pro Million Eingabetokens und 4,40 USD pro Million Ausgabetokens auf Zhipus Endpunkt; durch Caching sinken die Kosten für zwischengespeicherte Eingabetokens auf rund 0,26 USD pro Million. Der Abonnementplan „GLM Coding Plan“ ist bei regelmäßigem Einsatz oft günstiger: Promotionsstufen beginnen bei etwa 10 USD/Monat für „Lite“ und steigen bis zu ca. 80 USD/Monat für „Max“ (Listenpreise liegen höher). Drittanbieter wie OpenRouter nennen vergleichbare Preise pro Token.

Kann ich GLM 5.2 auf meiner eigenen GPU ausführen?

Nur, wenn „meine eigene GPU“ einen Mehr-GPU-Server bedeutet. Die ~753-Mrd.-Gewichte benötigen bei FP8 etwa 8× H200 oder bei INT4-Quantisierung etwa 4× H200 (bzw. mehr GPUs mit geringerem Speichervolumen); hinzu kommt durch das Kontextfenster von einer Million Tokens ein besonders großer KV-Cache-Bedarf. Eine einzelne Consumer-GPU reicht nicht aus, um dieses Modell auszuführen; dafür eignen sich kleinere, speziell für lokale Nutzung optimierte Modelle.

Funktioniert GLM 5.2 mit Claude Code?

Ja. Zhipu stellt einen mit Anthropic kompatiblen Endpunkt zur Verfügung, sodass Sie Claude Code einfach auf https://api.z.ai/api/anthropicverweisen glm-5.2[1m], das Modell auf

Wie groß ist das Kontextfenster von GLM 5.2 im Vergleich zu GLM 5.1?

Es ist fünfmal größer: 1.000.000 Tokens gegenüber rund 200.000 Tokens bei GLM 5.1. Die maximale Ausgabelänge bleibt ebenfalls hoch bei 131.072 Tokens – zusammen ermöglicht dies, eine gesamte Codebasis samt langer Agenten-Transkripte in einer einzigen Sitzung zu halten.

Hat Zhipu Benchmarks für GLM 5.2 veröffentlicht?

Nein – nicht bei der Vorstellung des Coding Plans am 13. Juni; diese Ankündigung konzentrierte sich auf Verfügbarkeit und die Roadmap für offene Gewichte. Doch als die Gewichte am 16. Juni öffentlich wurden, veröffentlichte Zhipu eine umfassende Benchmark-Tabelle; unabhängige Labore folgten: Artificial Analysis stuft GLM 5.2 als führendes Modell mit offenen Gewichten im Intelligence Index ein (51), und Code Arena platziert es auf Platz 2 bei Frontend-Programmieraufgaben. Herstellerseitige Agenten-Benchmark-Werte (SWE-bench Pro 62,1, Terminal-Bench 2,1 von 81,0) sollten dennoch stets anhand neutraler Bewertungen überprüft werden.

Ist GLM 5.2 besser als Kimi K2 oder DeepSeek für Programmieraufgaben?

Bei aggregierter Intelligenz nach unabhängigen Bewertungen liegt es derzeit vorn: Artificial Analysis bewertet GLM 5.2 mit 51 Punkten, während DeepSeek V4 Pro und Kimi K2.6 im niedrigen Vierzigbereich liegen; zudem führt GLM 5.2 bei Code Arenas Frontend-Ranking. Bei spezifischen agentenbasierten Programmieraufgaben kann sich dieser Vorsprung jedoch verringern oder sogar umkehren; alle drei Modelle veröffentlichen detaillierte SWE-bench-Ergebnisse. Für Entscheidungen mit hohem Risiko empfehlen wir daher, einen direkten Vergleich mit Ihrem eigenen Repository durchzuführen – statt sich allein auf eine einzige Rangliste zu verlassen.

Fazit

GLM 5.2 ist eine echte und bemerkenswerte Veröffentlichung: ein Codiermodell mit ~753 Milliarden Parametern, lizenziert unter der MIT-Lizenz, mit einem Kontextfenster von einer Million Tokens und einer sofort einsatzbereiten, mit Anthropic kompatiblen API, die es Ihnen ermöglicht, GLM 5.2 innerhalb weniger Sekunden in Claude Code oder Cline einzubinden. Für Nutzer mit intensiven agentenbasierten Programmieraufgaben, die lange Kontextfenster und eine permissive Lizenz wünschen, ergibt sich hier ein starkes Nutzen-Kosten-Verhältnis – und die Preisgestaltung des Coding Plans ist äußerst konkurrenzfähig.

Die Benchmark-Lücke, die die ersten 72 Stunden prägte, hat sich geschlossen: Unabhängige Evaluatoren bewerten GLM 5.2 mittlerweile als führendes Modell mit offenen Gewichten hinsichtlich aggregierter Intelligenz und als eines der besten bei Frontend-Programmieraufgaben – ein echtes Gütesiegel. Zwei Einschränkungen sollten jedoch im Blick behalten werden: Die spektakulärsten Behauptungen vom Typ „schlägt GPT-5.5“ beruhen auf herstellerspezifischen Agenten-Benchmarks, bei denen GLM 5.2 nach wie vor hinter Claude Opus 4.8 zurückbleibt; zudem verbraucht das Modell viele Ausgabetokens – prüfen Sie daher die Wirtschaftlichkeit anhand Ihrer eigenen Workloads. Auch die Hardware-Realität weist in dieselbe Richtung: Für nahezu alle Nutzer ist dies eine Cloud-API zum Testen – nicht ein Modell, dessen Gewichte man selbst hostet. Ein gründlicher Test ist zweifellos angebracht; ob sich eine vollständige Migration lohnt, hängt jedoch davon ab, wie gut GLM 5.2 in Ihrem konkreten Codeumfeld abschneidet – nicht danach, wo es in einer Rangliste steht.