LFM2.5-230M: apró AI-modell telefonra és Raspberry Pi-re

A Liquid AI 230 millió paraméteres LFM2.5 modellje telefonon 213, Raspberry Pi 5-ön 42 tokent generálhat másodpercenként.

A Liquid AI június 25-én kiadta eddigi legkisebb nyelvi modelljét. A vállalat hivatalos bemutatója szerint az LFM2.5-230M mindössze 230 millió paraméterből áll, és elsősorban helyben futó adatkinyerési, eszközhasználati és könnyű agentikus feladatokra készült. Telefonon vagy egy Raspberry Pi 5-ön is elfut, tehát nem adatközponti óriásmodell kicsinyített másáról van szó.

// ai/mi · 2026.05.06 NVIDIA járműfedélzeti AI-agent: így jöhet az okos autós asszisztens Az NVIDIA bemutatta, hogyan építhetnek az autógyártók járműfedélzeti AI-agenteket DRIVE AGX-alapokon, hibrid edge-cloud megközelítéssel. olvasás →

213 token másodpercenként egy Galaxy S25 Ultrán

A Liquid AI 4 bites kvantálással, 2000 tokenes bemeneti környezetben mérte a modellt. Egy Snapdragon 8 Elite lapkás Samsung Galaxy S25 Ultra készüléken 1158 token/másodperces előtöltési és 213 token/másodperces dekódolási sebességet kapott. A futás közben mért memóriaigény 375 MB volt.

Raspberry Pi 5-ön 523 token/másodperces előtöltést és 42 token/másodperces dekódolást mértek, 293 MB memóriahasználat mellett. Ezek gyártói eredmények, meghatározott kvantálással és beállításokkal; más programkönyvtár, hosszabb kontextus vagy eltérő hardver más számokat adhat.

Hibrid felépítés, 32 ezres kontextus

Az LFM2.5-230M tizennégy rétegből áll: nyolc kettős kapuzású LIV konvolúciós blokkot és hat csoportos lekérdezéses figyelmi, vagyis GQA-blokkot kombinál. A kontextusablak 32 768 token, a modell pedig tíz nyelvet támogat. Magyar nincs a felsorolt nyelvek között.

A modellt 19 billió tokenes tanítási kerettel készítették. A finomhangolás első szakaszában a 350 millió paraméteres LFM2.5-350M válaszaiból desztillálták, majd preferencia-optimalizálást és több területre kiterjedő megerősítéses tanulást kapott.

Egyes teszteken nagyobb modelleket is megelőz

Az utasításkövetést mérő IFEval teszten 71,71 pontot ért el. Ezzel a Liquid AI saját mérése szerint megelőzte a Gemma 3 1B IT 63,49-es és a Qwen3.5-0.8B 59,94-es eredményét. A CaseReportBench adatkinyerési teszten 22,51 pontot kapott, szemben a Qwen 13,83-as és a Gemma 2,28-as értékével.

Ettől még nem lett általánosan jobb náluk. GPQA Diamond és MMLU-Pro alatt például a Qwen3.5-0.8B erősebb, és a nagyobb LFM2.5-350M is szinte minden mérésben előrébb végzett. A 230M-es modell előnye a méret, a sebesség és az, hogy szűk feladatokra könnyen helyben tartható.

Mire használható, és mire nem?

A Liquid AI adatkinyeréshez, strukturált válaszokhoz, eszközhíváshoz és kisebb, helyben futó agentikus folyamatokhoz ajánlja. A vállalat egy Unitree G1 humanoid roboton is kipróbálta: a Jetson Orin fedélzeti gépén természetes nyelvű utasításokat bontott előre betanított mozgáskészségekre.

Összetett matematikára, komoly kódgenerálásra és kreatív szövegírásra maga a fejlesztő sem ajánlja. A modell Transformers, llama.cpp, MLX, vLLM, SGLang és ONNX formában érhető el, így a lényeg itt nem egy újabb chatbot, hanem egy kicsi, célfeladatra szabható helyi komponens.

A Liquid AI 230 millió paraméteres modellje telefonon is villámgyors

213 token másodpercenként egy Galaxy S25 Ultrán

Hibrid felépítés, 32 ezres kontextus

Egyes teszteken nagyobb modelleket is megelőz

Mire használható, és mire nem?