Kimi K2.7 Code: új fejlesztői AI-modell a Moonshottól

A Kimi K2.7 Code a Moonshot új, kódolásra hangolt modellje 256K kontextussal, kötelező thinking móddal és agresszív fejlesztői árazással.

A Kimi/Moonshot hivatalos API-dokumentációja és a Kimi eredeti X-bejegyzése alapján megjelent a Kimi K2.7 Code, amelyet a cég jelenleg a legerősebb kódolásra szánt modelljeként kezel. Ez nem általános chatbot-frissítésnek néz ki, hanem kifejezetten fejlesztői munkára húzott modellnek: hosszabb kódbázisok, több lépéses feladatok, tool-használat, és olyan környezetek, ahol nem elég egy jól hangzó válasz.

A bejelentés azért érdekes, mert a kínai AI-modellek versenye az elmúlt hónapokban látványosan átterelődött a kódolásra. A DeepSeek, az Alibaba Qwen-vonala és a Moonshot Kimi-modelljei ugyanarra a területre lőnek: olyan fejlesztői asszisztensekre, amelyek nem csak snippetet írnak, hanem hosszabb munkamenetben is követik az utasítást.

// ai/mi · 2026.05.27 Alibaba új AI-modellje már az OpenAI-t és a Google-t is előzi egyes kódolási ranglistákon Az Alibaba új Qwen AI-modellje egyre komolyabb figyelmet kap az AI-iparban. A legfrissebb Code Arena rangsor szerint a vállalat egyik új modellje már több OpenAI-… olvasás →

A Kimi K2.7 Code nem mindenesnek készül

A Kimi dokumentációja elég egyértelműen fogalmaz: a K2.7 Code a cég eddigi legerősebb kódolómodellje, amely megbízhatóbban követi az utasításokat hosszú kontextusban, és nagyobb sikeraránnyal fejez be kódolási feladatokat. Ez a különbség papíron aprónak tűnhet, de fejlesztői munkánál pont itt szoktak szétesni az AI-asszisztensek.

Egy modell tudhat gyorsan komponenseket generálni, de ha egy nagyobb feladatnál elfelejti a korábbi döntéseket, rosszul kezeli a fájlstruktúrát, vagy a harmadik lépésnél már más problémát old meg, akkor a teljesítménye nem sokat ér. A K2.7 Code állítása szerint pont az ilyen hosszabb, összefüggő munkamenetekben próbál előrelépni.

Illusztráció: BytePoint

256K kontextus, kötelező gondolkodó mód

A modell egyik fontos paramétere a 256K kontextusablak. Ez nem egyedülálló a Kimi-palettán, mert a dokumentáció szerint a K2.7 Code, a K2.6 és a K2.5 is ekkora kontextust kínál, de a kódolásnál ennek konkrét gyakorlati értelme van. Egy nagyobb projektben nem csak egy fájlt kell látni, hanem függőségeket, korábbi döntéseket, hibákat, konfigurációt és teszteket is.

A K2.7 Code másik érdekes részlete, hogy nem támogatja a nem gondolkodó módot. A dokumentáció szerint a thinking módot nem lehet kikapcsolni, a modell pedig több lépéses tool-használatra és érvelésre van hangolva. Ez azt jelenti, hogy a Kimi itt nem a leggyorsabb, legolcsóbb válaszra optimalizál, hanem arra, hogy bonyolultabb fejlesztői feladatoknál végig tudja vinni a gondolatmenetet.

A benchmarkok jól hangzanak, de érdemes óvatosan olvasni őket

A Kimi X-posztja szerint a K2.7 Code a K2.6-hoz képest 21,8 százalékot javult a Kimi Code Bench v2-n, 11 százalékot a Program Benchen, és 31,5 százalékot az MLS Bench Lite-on. A cég azt is állítja, hogy a modell körülbelül 30 százalékkal kevesebb reasoning tokent használ azonos jellegű feladatoknál.

Ez erős üzenet, de nem ugyanaz, mintha független, szélesen használt benchmarkokon látnánk részletes összevetést GPT-, Claude- vagy Gemini-modellekkel. A Kimi Code Bench v2 például házon belüli mérésnek tűnik, ezért a számokat érdemes a helyükön kezelni: jó jel, hogy a K2.7 Code látványosan javul a K2.6-hoz képest, de ebből önmagában még nem következik, hogy minden fejlesztői feladatban piacvezető lenne.

Az árképzés is támadja a nyugati mezőnyt

A Kimi platformoldala szerint a K2.7 Code ára cache találatnál 0,19 dollár egymillió tokenenként, bemenetnél 0,95 dollár, kimenetnél pedig 4 dollár egymillió tokenenként. A pontos összehasonlítás mindig attól függ, milyen feladatról, milyen cache-aránnyal és milyen tool-használattal beszélünk, de az irány világos: a Moonshot nem csak képességben, hanem árban is fejlesztői alternatívát akar adni.

Ez a kódolómodelleknél különösen fontos. Egy hosszabb agentic munkamenet gyorsan sok tokent fogyaszt, főleg ha a modell fájlokat olvas, diffeket értelmez, hibákat javít és újraellenőriz. Ilyenkor a tokenár nem elméleti táblázat, hanem nagyon is konkrét költség.

Miért számít ez?

A Kimi K2.7 Code nem attól érdekes, hogy megint lett egy új modellnév. Attól érdekes, hogy a kódolásra optimalizált AI-modellek piaca kezd leválni az általános chatbot-versenyről. A fejlesztők nem azt kérdezik, hogy egy modell mennyire frappánsan válaszol, hanem azt, hogy képes-e egy nagyobb feladatot végigcsinálni úgy, hogy közben nem rombolja le a projektet.

Ha a K2.7 Code valóban stabilabb hosszú kontextusban, jobban kezeli a Rust, Go és Python jellegű eltérő feladatokat, és közben érezhetően takarékosabban gondolkodik, akkor a Moonshot komolyabb szereplő lehet a fejlesztői AI-eszközök között. A végső választ persze nem a bejelentőposzt adja meg, hanem az, hogy valós kódbázisokon mennyi kézi javítás marad utána.

Megjelent a Kimi K2.7 Code, és a Moonshot most kifejezetten a fejlesztőkre céloz

A Kimi K2.7 Code nem mindenesnek készül

256K kontextus, kötelező gondolkodó mód

A benchmarkok jól hangzanak, de érdemes óvatosan olvasni őket

Az árképzés is támadja a nyugati mezőnyt

Miért számít ez?