A Meituan hivatalos LongCat 2.0 tárhelye szerint az új, Mixture-of-Experts felépítésű nyelvi modell összesen 1,6 billió paramétert tartalmaz, miközben tokenenként körülbelül 48 milliárdot aktivál. A korábbi Preview után most jóval több technikai részlet került nyilvánosságra, de a modell súlyai még nem tölthetők le: a fejlesztők szerint később érkeznek.
Több mint 50 ezer hazai gyorsítón tanították
A Meituan állítása szerint a teljes előtanítás és a nagy léptékű futtatás is kínai AI ASIC szuperklasztereken történt. A tanítás több mint 50 ezer gyorsítót, több millió gyorsítóórát és 35 billiónál is több tokent használt fel. Ez azért fontos, mert a kínai chipeket eddig sokkal gyakrabban láttuk kész modellek futtatásánál, mint ekkora előtanítási feladatnál.
A vállalat nem nevezte meg közvetlenül a hardver szállítóját. A South China Morning Post ugyanakkor kiemelte, hogy a rendszer a Huawei HCCL kommunikációs könyvtárát használta a több tízezer gyorsító összekapcsolásához és a tanítás stabilizálásához.
Egymillió tokenes kontextus, de nem minden paraméter dolgozik
A LongCat 2.0 egymillió tokenes kontextusablakot támogat. Ezt a LongCat Sparse Attention nevű megoldással próbálják kezelhető költség mellett megvalósítani. A modell MoE felépítése közben nem mozgatja meg mind az 1,6 billió paramétert minden egyes válasznál: körülbelül 48 milliárd aktív paraméter vesz részt egy token feldolgozásában.
Ez nem teszi kicsivé a modellt, de fontos különbség. Az 1,6 billiós teljes méret inkább a rendelkezésre álló szakértői kapacitást mutatja, míg az aktív paraméterszám közelebb visz az egy válaszhoz szükséges tényleges számítási munkához.
A saját mérések erősek, a független tesztek még hiányoznak
A Meituan elsősorban programozási, keresési és agentfeladatokra pozicionálja a LongCat 2.0-t. A közölt eredmények szerint a modell a Terminal-Bench 2.1 teszten 70,8, a SWE-bench Pro mérésben 59,5, a többnyelvű SWE-bench változatban pedig 78,3 pontot ért el. Egyes próbákon megelőzi a Google Gemini 3.1 Pro közölt eredményét, a legerősebb OpenAI- és Anthropic-modellektől azonban több mérésben elmarad.
Ezeket az adatokat egyelőre maga a Meituan mérte, egységesnek nevezett saját tesztkörnyezetben. A LongCat 2.0 még nem szerepel a nagyobb független rangsorokban, ezért a valódi helyét csak külső tesztek után lehet megítélni.
A technikai bizonyítás most fontosabb a chatbotnál
A LongCat 2.0 jelenlegi legnagyobb állítása nem az, hogy minden feladatban ez lenne a legerősebb modell. A Meituan inkább azt akarja megmutatni, hogy egy 1,6 billió paraméteres rendszer teljes tanítása és futtatása Nvidia gyorsítók nélkül is megoldható. Ha ezt függetlenül is sikerül igazolni, annak jóval nagyobb súlya lehet a kínai AI-ipar számára, mint néhány megnyert benchmarknak.