A NVIDIA GTC Taipei 2026 keynote egyik legfontosabb üzenete az volt, hogy Jensen Huang szerint az AI következő nagy lépése már nem egyszerűen a nagyobb modell, hanem az ügynökalapú, feladatokat végrehajtó rendszer, amelyhez az NVIDIA a teljes számítógépes infrastruktúrát újra akarja rendezni.
A keynote physical AI-s része külön is megérne egy saját anyagot, de a bemutató másik fele talán még fontosabb volt azoknak, akik PC-ben, szerverben, adatközpontban vagy AI-infrastruktúrában gondolkodnak. Huang lényegében azt mondta el, hogy az AI nem csak egy új alkalmazásréteg lesz a meglévő gépeken, hanem olyan terhelés, amely másfajta memóriát, hálózatot, energiaelosztást, hűtést és helyi gépeket kér.
Az AI-ügynök nem csak válaszolni akar
Huang a színpadon azt hangsúlyozta, hogy az „agentic AI” szerinte megérkezett, és ez alatt nem pusztán chatbotokat értett. A példái alapján az ügynök olyan rendszer, amelynek van modellje, környezete, eszközkészlete, memóriája és futtatási logikája, tehát nem csak szöveget generál, hanem feladatokat bont le, programokat hív meg, fájlokat készít, keres, számol, és közben vissza is tud térni korábbi állapotokhoz.
Ez azért fontos különbség, mert egy ilyen rendszer nem ugyanúgy terheli a gépet, mint egy klasszikus program vagy egy egyszerű lekérdezés. A nagy nyelvi modell gondolkodása, a külső eszközök futtatása, a memória, a visszakeresés és az engedélyezés mind más-más része a folyamatnak, ezért az NVIDIA most már nem csak gyorsabb GPU-ról beszél, hanem teljes, több komponensből álló számítási környezetről.
A CUDA-X könyvtárakat Huang ebben a logikában nem egyszerű fejlesztői gyorsítóknak, hanem az AI-ügynökök eszközeinek nevezte. A lényeg nem az, hogy egy modell mindent belülről tudjon, hanem az, hogy szükség esetén hozzáférjen optimalizált könyvtárakhoz, mérnöki, tudományos, hálózati vagy robotikai funkciókhoz, és ezeket egy nagyobb feladat részeként használja.
Vera Rubin már nem egy chipként jelenik meg
A Vera Rubin rész pontosan ebbe a gondolatmenetbe illeszkedett. Huang külön kiemelte, hogy a Vera Rubin nem egyetlen chip, hanem rendszer: CPU-k, GPU-k, hálózati elemek, DPU-k, szoftverréteg és biztonsági megoldások együttese, amelyet az NVIDIA az agentic AI futtatására pozicionál.

A bemutatóban elhangzott a Vera CPU, a Vera Rubin NVL72, a BlueField, a ConnectX-9 és a DOCA neve is, vagyis az NVIDIA nem egy különálló gyorsítókártyaként mutatta be a következő nagy platformját, hanem olyan infrastruktúraként, ahol a modell futtatása, az eszközök kezelése, a hálózat és a biztonság ugyanannak a rendszernek a része.
Ez a szemlélet jól mutatja, merre tolódik a vállalat kommunikációja. Az NVIDIA régen könnyen leírható volt GPU-gyártóként, ma viszont Huang sokkal inkább rendszer- és infrastruktúra-cégként beszél róla, ahol a chip csak az egyik darabja annak a gépezetnek, amelyet az AI-gyárakba szánnak.
Az AI-gyár már energia- és hűtési kérdés is
Az AI factory kifejezést az NVIDIA régóta használja, de most a DSX miatt kapott konkrétabb formát. A keynote alapján a DSX egy referencia-koncepció az AI-gyárak tervezésére és működtetésére: a DSX Sim az Omniverse-alapú szimulációs rész, amellyel a létesítményt még a tényleges rackek megrendelése előtt lehet modellezni, a DSX OS pedig az üzemeltetés, monitorozás és hibakezelés irányába mutat.

Huang szerint a mai AI-gyárak energiaoldalon akár 40 százalékos túltervezéssel is dolgozhatnak, mert a terhelés nem egyenletes, a csúcsterhelésre viszont fel kell készülni. Erre válaszként beszélt a DSX MaxLPS megoldásról, a 45 Celsius-fokos forróvizes folyadékhűtésről és arról, hogy a teljes létesítménynek dinamikusan kellene alkalmazkodnia a rendelkezésre álló teljesítményhez.
Ez elsőre nagyon adatközpontos témának tűnik, de valójában az AI költségének egyik legkeményebb pontjáról van szó. Ha egy gigawattos AI-gyár Huang megfogalmazása szerint már több tízmilliárd dolláros beruházási kategória, akkor nem csak az számít, hogy mennyi számítási teljesítmény fér egy rackbe, hanem az is, hogy mennyi energia vész el tartalékban, hűtésben vagy rosszul ütemezett terhelésben.
A PC-t sem hagyná ki az NVIDIA
A keynote PC-s része azért volt különösen érdekes, mert az előzetes teaserek után Huang tényleg a Microsofttal közös irányról beszélt. Az NVIDIA RTX Spark kapcsán egy olyan Windows-kompatibilis vonalat vázolt fel, amely laptopot, asztali gépet és munkaállomást is lefedne, miközben CUDA-t és NVIDIA AI Tensor Core gyorsítást is adna a helyi AI-feladatokhoz.

Itt a legerősebb üzenet az volt, hogy az AI nem minden esetben a felhőben futna. Huang olyan helyi gépekről beszélt, amelyek folyamatosan elérhető személyes vagy fejlesztői AI-környezetként működhetnek, és a felhasználó saját gépén futtathatnak ügynököket, modelleket vagy fejlesztői munkafolyamatokat.

A DGX Station említése még tovább tolta ezt az irányt: a bemutató szerint a Windows-kompatibilis munkaállomás 768 GB memóriával érkezhet, és Huang azt állította, hogy akár billió paraméteres modellek futtatására is alkalmas lehet. Ezt érdemes NVIDIA-állításként kezelni, de jól jelzi, hogy a cég nem csak adatközponti skálán, hanem asztali és munkaállomásos környezetben is helyet akar fogni az AI-korszakban.
A közös nevező: az AI már nem egy program
A keynote maradék, nem physical AI-ról szóló része így elég világos képet ad az NVIDIA gondolkodásáról. A vállalat szerint az AI-ügynök nem egy alkalmazás a sok közül, hanem olyan új számítási forma, amely egyszerre alakítja át a fejlesztői gépet, a munkaállomást, a szervert, a hálózatot, az adatközpontot és az energiafelhasználást.
Ez persze még erősen NVIDIA-s nézőpont, ezért érdemes óvatosan kezelni a nagy ívű állításokat, de az irány így is fontos: ha az ügynökalapú AI tényleg tömegesen elterjed, akkor nem csak gyorsabb chipekre lesz szükség, hanem olyan gépekre és AI-gyárakra, amelyek eleve erre a munkamódra vannak felépítve.