A Kimi/Moonshot hivatalos API-dokumentációja és a Kimi eredeti X-bejegyzése alapján megjelent a Kimi K2.7 Code, amelyet a cég jelenleg a legerősebb kódolásra szánt modelljeként kezel. Ez nem általános chatbot-frissítésnek néz ki, hanem kifejezetten fejlesztői munkára húzott modellnek: hosszabb kódbázisok, több lépéses feladatok, tool-használat, és olyan környezetek, ahol nem elég egy jól hangzó válasz.
A bejelentés azért érdekes, mert a kínai AI-modellek versenye az elmúlt hónapokban látványosan átterelődött a kódolásra. A DeepSeek, az Alibaba Qwen-vonala és a Moonshot Kimi-modelljei ugyanarra a területre lőnek: olyan fejlesztői asszisztensekre, amelyek nem csak snippetet írnak, hanem hosszabb munkamenetben is követik az utasítást.
A Kimi K2.7 Code nem mindenesnek készül
A Kimi dokumentációja elég egyértelműen fogalmaz: a K2.7 Code a cég eddigi legerősebb kódolómodellje, amely megbízhatóbban követi az utasításokat hosszú kontextusban, és nagyobb sikeraránnyal fejez be kódolási feladatokat. Ez a különbség papíron aprónak tűnhet, de fejlesztői munkánál pont itt szoktak szétesni az AI-asszisztensek.
Egy modell tudhat gyorsan komponenseket generálni, de ha egy nagyobb feladatnál elfelejti a korábbi döntéseket, rosszul kezeli a fájlstruktúrát, vagy a harmadik lépésnél már más problémát old meg, akkor a teljesítménye nem sokat ér. A K2.7 Code állítása szerint pont az ilyen hosszabb, összefüggő munkamenetekben próbál előrelépni.

256K kontextus, kötelező gondolkodó mód
A modell egyik fontos paramétere a 256K kontextusablak. Ez nem egyedülálló a Kimi-palettán, mert a dokumentáció szerint a K2.7 Code, a K2.6 és a K2.5 is ekkora kontextust kínál, de a kódolásnál ennek konkrét gyakorlati értelme van. Egy nagyobb projektben nem csak egy fájlt kell látni, hanem függőségeket, korábbi döntéseket, hibákat, konfigurációt és teszteket is.
A K2.7 Code másik érdekes részlete, hogy nem támogatja a nem gondolkodó módot. A dokumentáció szerint a thinking módot nem lehet kikapcsolni, a modell pedig több lépéses tool-használatra és érvelésre van hangolva. Ez azt jelenti, hogy a Kimi itt nem a leggyorsabb, legolcsóbb válaszra optimalizál, hanem arra, hogy bonyolultabb fejlesztői feladatoknál végig tudja vinni a gondolatmenetet.
A benchmarkok jól hangzanak, de érdemes óvatosan olvasni őket
A Kimi X-posztja szerint a K2.7 Code a K2.6-hoz képest 21,8 százalékot javult a Kimi Code Bench v2-n, 11 százalékot a Program Benchen, és 31,5 százalékot az MLS Bench Lite-on. A cég azt is állítja, hogy a modell körülbelül 30 százalékkal kevesebb reasoning tokent használ azonos jellegű feladatoknál.
Ez erős üzenet, de nem ugyanaz, mintha független, szélesen használt benchmarkokon látnánk részletes összevetést GPT-, Claude- vagy Gemini-modellekkel. A Kimi Code Bench v2 például házon belüli mérésnek tűnik, ezért a számokat érdemes a helyükön kezelni: jó jel, hogy a K2.7 Code látványosan javul a K2.6-hoz képest, de ebből önmagában még nem következik, hogy minden fejlesztői feladatban piacvezető lenne.
Az árképzés is támadja a nyugati mezőnyt
A Kimi platformoldala szerint a K2.7 Code ára cache találatnál 0,19 dollár egymillió tokenenként, bemenetnél 0,95 dollár, kimenetnél pedig 4 dollár egymillió tokenenként. A pontos összehasonlítás mindig attól függ, milyen feladatról, milyen cache-aránnyal és milyen tool-használattal beszélünk, de az irány világos: a Moonshot nem csak képességben, hanem árban is fejlesztői alternatívát akar adni.
Ez a kódolómodelleknél különösen fontos. Egy hosszabb agentic munkamenet gyorsan sok tokent fogyaszt, főleg ha a modell fájlokat olvas, diffeket értelmez, hibákat javít és újraellenőriz. Ilyenkor a tokenár nem elméleti táblázat, hanem nagyon is konkrét költség.
Miért számít ez?
A Kimi K2.7 Code nem attól érdekes, hogy megint lett egy új modellnév. Attól érdekes, hogy a kódolásra optimalizált AI-modellek piaca kezd leválni az általános chatbot-versenyről. A fejlesztők nem azt kérdezik, hogy egy modell mennyire frappánsan válaszol, hanem azt, hogy képes-e egy nagyobb feladatot végigcsinálni úgy, hogy közben nem rombolja le a projektet.
Ha a K2.7 Code valóban stabilabb hosszú kontextusban, jobban kezeli a Rust, Go és Python jellegű eltérő feladatokat, és közben érezhetően takarékosabban gondolkodik, akkor a Moonshot komolyabb szereplő lehet a fejlesztői AI-eszközök között. A végső választ persze nem a bejelentőposzt adja meg, hanem az, hogy valós kódbázisokon mennyi kézi javítás marad utána.