A kínai Zhipu AI (amely nemrégiben Z.ai néven márkázta át magát a nemzetközi piacon) hivatalosan is kiadta legújabb zászlóshajó nyílt forrású modelljét, a GLM-5.2-t. A 744 milliárd paraméteres Mixture-of-Experts (MoE) architektúrára épülő modell stabil, 1 millió tokenes kontextusablakkal rendelkezik, és a fejlesztők a liberális MIT licenc alatt tették közzé. A modell rendkívüli képességeiről és a kódolási maratonokon nyújtott teljesítményéről a The Decoder és a MarkTechPost is beszámolt.
Zhipu GLM-5.2 vs. Anthropic Claude Opus 4.8
A GLM-5.2 a legújabb szoftverfejlesztési és ágensekre szabott benchmarkokon elképesztő eredményeket ért el, közvetlenül megszorongatva a piacvezető zárt forrású modelleket. A FrontierSWE nevű, többórás kódolási feladatokat vizsgáló benchmarkon a kínai modell mindössze 1 százalékponttal maradt le az Anthropic csúcsmodelljétől, a Claude Opus 4.8-tól, miközben maga mögé utasította az OpenAI GPT-5.5-öt. A SWE-bench Pro teszten a GLM-5.2 62,1-es pontszámot szerzett (szemben a GPT-5.5 58,6-os eredményével), míg az autonóm terminál-műveleteket mérő Terminal-Bench 2.1-en kiemelkedő, 81,0-es pontot ért el, megszilárdítva helyét a legerősebb nyílt forrású kódoló modellként.

IndexShare architektúra és a választató gondolkodási módok
A Z.ai fejlesztői több technológiai újítással tették használhatóvá a hatalmas kontextust. Az „IndexShare” mechanizmus segítségével a hosszú lekérdezések során a tokenenkénti számítási igényt 2,9-szeresére csökkentették, míg a multi-token predikció (MTP) a spekulatív dekódolás felgyorsítását szolgálja. Ezen felül a modell támogatja a felhasználó által szabályozható gondolkodási szinteket: a „High” és „Max” beállításokkal szabályozható, hogy a modell mennyi időt és logikai lépést szenteljen a komplex problémák átgondolására a válaszadás előtt.

OpenAI-kompatibilis API a gyakorlatban
A GLM-5.2-höz nem feltétlenül szükséges méregdrága, több H100-as GPU-ból álló saját klasztert építeni, ugyanis a Z.ai egy teljes mértékben OpenAI-kompatibilis API platformot is biztosít. A fejlesztők így a megszokott könyvtárakat és chat-wrapper kódokat használva érhetik el a modellt. Az API támogatja a folyamatos (streamelt) gondolkodási válaszokat, a strukturált JSON kimeneteket, a fejlett függvényhívásokat (function calling), valamint a hosszú kontextusú dokumentumokból való visszakeresést, mindezt pontos token- és költségelszámolás mellett.
