A kínai Zhipu AI (amely nemrégiben Z.ai néven márkázta át magát a nemzetközi piacon) hivatalosan is kiadta legújabb zászlóshajó nyílt forrású modelljét, a GLM-5.2-t. A 744 milliárd paraméteres Mixture-of-Experts (MoE) architektúrára épülő modell stabil, 1 millió tokenes kontextusablakkal rendelkezik, és a fejlesztők a liberális MIT licenc alatt tették közzé. A modell rendkívüli képességeiről és a kódolási maratonokon nyújtott teljesítményéről a The Decoder és a MarkTechPost is beszámolt.

// ai/mi · 2026.06.22 Jeff Bezos szerint a mesterséges intelligencia nem elveszi, hanem szaporítja majd a munkahelyeket Miközben a világ nagyvállalatai gőzerővel fektetnek be a mesterséges intelligenciába, a munkavállalók körében folyamatos a szorongás a tömeges leépítések miatt. Jeff Bezos, az Amazon alapítója… olvasás →

Zhipu GLM-5.2 vs. Anthropic Claude Opus 4.8

A GLM-5.2 a legújabb szoftverfejlesztési és ágensekre szabott benchmarkokon elképesztő eredményeket ért el, közvetlenül megszorongatva a piacvezető zárt forrású modelleket. A FrontierSWE nevű, többórás kódolási feladatokat vizsgáló benchmarkon a kínai modell mindössze 1 százalékponttal maradt le az Anthropic csúcsmodelljétől, a Claude Opus 4.8-tól, miközben maga mögé utasította az OpenAI GPT-5.5-öt. A SWE-bench Pro teszten a GLM-5.2 62,1-es pontszámot szerzett (szemben a GPT-5.5 58,6-os eredményével), míg az autonóm terminál-műveleteket mérő Terminal-Bench 2.1-en kiemelkedő, 81,0-es pontot ért el, megszilárdítva helyét a legerősebb nyílt forrású kódoló modellként.

Zhipu AI GLM-5.2 FrontierSWE long-horizon software engineering benchmarks
A GLM-5.2 teljesítménye a FrontierSWE és SWE-bench kódolási maratonokon (Forrás: Zhipu AI / The Decoder)

IndexShare architektúra és a választató gondolkodási módok

A Z.ai fejlesztői több technológiai újítással tették használhatóvá a hatalmas kontextust. Az „IndexShare” mechanizmus segítségével a hosszú lekérdezések során a tokenenkénti számítási igényt 2,9-szeresére csökkentették, míg a multi-token predikció (MTP) a spekulatív dekódolás felgyorsítását szolgálja. Ezen felül a modell támogatja a felhasználó által szabályozható gondolkodási szinteket: a „High” és „Max” beállításokkal szabályozható, hogy a modell mennyi időt és logikai lépést szenteljen a komplex problémák átgondolására a válaszadás előtt.

Zhipu AI GLM-5.2 clock latency vs reasoning effort level control
A gondolkodási erőfeszítés szintjének hatása a pontosságra és a válaszadási késleltetésre (Forrás: Zhipu AI)

OpenAI-kompatibilis API a gyakorlatban

A GLM-5.2-höz nem feltétlenül szükséges méregdrága, több H100-as GPU-ból álló saját klasztert építeni, ugyanis a Z.ai egy teljes mértékben OpenAI-kompatibilis API platformot is biztosít. A fejlesztők így a megszokott könyvtárakat és chat-wrapper kódokat használva érhetik el a modellt. Az API támogatja a folyamatos (streamelt) gondolkodási válaszokat, a strukturált JSON kimeneteket, a fejlett függvényhívásokat (function calling), valamint a hosszú kontextusú dokumentumokból való visszakeresést, mindezt pontos token- és költségelszámolás mellett.

GLM-5.2 Mixture-of-Experts neural network architecture layout with IndexShare
A Mixture-of-Experts (MoE) architektúra és a hosszú kontextust kezelő hálózati rétegek felépítése (Forrás: Zhipu AI)