NVIDIA physical AI: Cosmos 3, GR00T, robotaxi, TSMC és egészségügy

Az NVIDIA öt egymásra épülő bejelentéssel mutatta meg, mire gondol physical AI alatt: Cosmos 3, Isaac GR00T humanoid robot, robotaxi-modellek, TSMC-s chipgyártási AI és tajvani egészségügyi agentek.

Az NVIDIA a GTC Taipei környékén öt, egymáshoz nagyon szorosan kapcsolódó bejelentéssel próbálta megmutatni, mit ért physical AI alatt: a Cosmos 3 az alapmodell, az Isaac GR00T referenciarobot a humanoid kutatási ág, az Alpamayo 2 Super a robotaxi-vonal, a TSMC-s együttműködés a chipgyártásba viszi be az AI-t, a Foxconn és tajvani egészségügyi központokkal közös program pedig azt mutatja, hogyan nézne ki mindez kórházi környezetben.

// ai/mi · 2026.05.13 A CPU-k visszatérése: az AI-forradalom új nyertesei lehetnek az Intel és az AMD Az elmúlt három év gyakorlatilag a GPU-król szólt. A NVIDIA AI-gyorsítói dominálták a piacot, miközben sokan már temették a klasszikus szerverprocesszorokat. Most azonban egyre több… olvasás →

Ezért szerintem érdemes egyben nézni a öt hírt. Külön-külön mindegyik lehetne egy sajtóközleményes technológiai bejelentés, együtt viszont kirajzolódik az NVIDIA nagyobb terve: nem csak GPU-t, modellt vagy fejlesztői eszközt akar adni, hanem teljes útvonalat a digitális szimulációtól a humanoid robotokig, autonóm autókig, gyárakig és kórházakig.

1. Cosmos 3: az alapmodell, amelynek értenie kell a fizikai világot

Kép: NVIDIA Newsroom / Cosmos 3

A Cosmos 3 az NVIDIA új, nyílt physical AI foundation modellje, amelyet a cég mixture-of-transformers architektúrára épített. A megközelítés lényege, hogy a modell nem csak képet vagy videót generál, hanem egyszerre próbál látni, érteni, világállapotokat szimulálni és cselekvési pályákat előre jelezni. Ez a különbség a hagyományos multimodális modell és a physical AI között: itt nem elég leírni, mi van a képen, azt is tudni kell, mi történhet utána a térben.

Az NVIDIA szerint a Cosmos 3 szöveget, képet, videót, környezeti hangot és cselekvéseket is kezel, és többféle szerepben használható: látás-nyelvi modellként, fizikai környezeteket szimuláló world modelként, illetve olyan háttérként, amely robotok vagy autonóm járművek policy modelljeinek betanítását segítheti. A Cosmos 3 Super és Cosmos 3 Nano már elérhető, a Cosmos 3 Edge pedig később jön real-time edge inference feladatokra.

A legfontosabb rész nem a név, hanem az, hogy az NVIDIA nyíltabb ökoszisztémát próbál építeni köré. A Cosmos Coalition alapító tagjai között ott van többek között az Agile Robots, a Black Forest Labs, a Generalist, az LTX, a Runway és a Skild AI, vagyis a cég nem csak saját belső stackként képzeli el a physical AI-t, hanem olyan fejlesztői alapként, amelyre robotikai, autonóm járműves és ipari szereplők is ráépülhetnek.

2. Isaac GR00T: nyílt referenciarobot a humanoid kutatáshoz

Kép: NVIDIA Newsroom / Isaac GR00T Reference Humanoid Robot

Az új ötödik elem az Isaac GR00T Reference Humanoid Robot, amely azért fontos, mert a physical AI történetben ez már nem csak modell vagy szimuláció, hanem egy konkrét humanoid referenciafelépítés. Az NVIDIA szerint a rendszer egy Unitree H2 Plus humanoid robotot, Sharpa Wave ötujjas taktilis kezeket, Jetson AGX Thor T5000 fedélzeti számítást és Isaac GR00T nyílt szoftveres/modellezési stacket kapcsol össze.

A hardver oldalán a robot a kezekkel együtt 75 szabadságfokig megy, több nézetű érzékelést kap, a Jetson AGX Thor T5000 pedig Blackwell GPU-val, 14 magos Arm CPU-val, 128 GB egységes memóriával és 40-130 watt között konfigurálható fogyasztással dolgozik. Az NVIDIA az akkumulátornál körülbelül háromórás üzemidőt említ, a biztonság miatt pedig távoli vészleállítás is része a rendszernek.

A szoftveres oldal legalább ennyire lényeges: az Isaac Teleop adatgyűjtésre, az Isaac GR00T modellek humanoid érvelésre és többfeladatos viselkedésre, az Isaac Sim és Isaac Lab pedig szimulációra, tesztelésre és policy-tréningre szolgál. A referenciahardvert több kutatóintézmény, köztük az Ai2, az ETH Zurich, a Stanford Robotics Center és a UC San Diego Advanced Robotics and Controls Laboratory is használni fogja, a Unitree-n keresztüli elérhetőséget pedig 2026 végére ígéri az NVIDIA.

3. Alpamayo 2 Super: robotaxihoz már nem elég „látni”, érvelni is kell

Kép: NVIDIA Newsroom / Alpamayo 2 Super

Az Alpamayo 2 Super ugyanezt a gondolatot viszi át az önvezető autók világába. Ez egy 32 milliárd paraméteres, reasoning-alapú vision-language-action modell, amelyet az NVIDIA kifejezetten 4-es szintű robotaxi-fejlesztéshez pozicionál. A modell nem csak pályát becsül, hanem magasabb szintű vezetési döntéseket is próbál kezelni, például azt, hogy mikor kell sávot váltani, megállni vagy elsőbbséget adni.

A bejelentésben három elem különösen fontos. Az egyik a 360 fokos környezetértelmezés, vagyis a modell már nem csak előre néző kamerákra támaszkodik. A másik az AlpaGym, egy zárt hurkú reinforcement learning keretrendszer, amelyben a döntések következményeit szimulációban lehet visszacsatolni. A harmadik az OmniDreams, egy generatív world model, amellyel ritka, veszélyes vagy nehezen begyűjthető közlekedési helyzeteket lehet fotorealisztikus szimulációban előállítani.

Ez azért lényeges, mert az önvezetés legnehezebb része nem az átlagos napsütéses útvonal, hanem a hosszú farok: az a rengeteg ritka helyzet, amelyből kevés valós adat van, de ha rosszul reagál rá az autó, abból baj lehet. Az NVIDIA itt azt állítja, hogy a physical AI stack képes lerövidíteni az adatgyűjtés, annotálás, szimuláció, validáció és járműbe telepítés közötti kört. Az Alpamayo 2 Super a tervek szerint nyáron lesz elérhető GitHubon és Hugging Face-en.

4. TSMC: az AI már nem csak chipeken fut, hanem chipeket is gyárt

Kép: NVIDIA Newsroom / NVIDIA és TSMC

A TSMC-s bejelentés elsőre kilóg a robotaxis és humanoidos irányból, valójában viszont nagyon jól illik a képbe. Az NVIDIA szerint a TSMC több ponton is használja a vállalat gyorsított számítási és AI-technológiáit a félvezetőtervezésben és gyártásban: litográfiában, tranzisztor- és folyamatszimulációban, fejlett folyamatvezérlésben, gyári optimalizációban és hibadetektálásban.

A konkrétumok között ott van a cuLitho, amelyet a TSMC számítási litográfiai feladatok gyorsítására használ, a cuEST, amely az NVIDIA szerint átlagosan 50-szer gyorsabb kémiai szimulációt adhat félvezető-anyagtervezéshez, valamint a cuML, amely nagy mennyiségű gyártási paraméter elemzésében segít. Emellett a TSMC Metropolis és TAO Toolkit alapú látás-AI-t is használ hibák osztályozására, különösen olyan nanométeres skálájú eltéréseknél, ahol a kézi címkézés és újratanítás nagyon gyorsan szűk keresztmetszetté válhat.

A legérdekesebb rész talán a FabTwin, egy Omniverse-alapú virtuális fabkörnyezet, amellyel a TSMC gyártóeszköz-elrendezéseket és kapcsolódó szimulációs folyamatokat tud vizsgálni, még mielőtt fizikai beruházás vagy átrendezés történne. Ez ugyan kevésbé látványos, mint egy robotaxi, de üzletileg óriási tét: a modern chipgyárakban a hibás döntések nagyon drágák, ezért a „digital twin előbb, fizikai változtatás később” logika rengeteget érhet.

5. Foxconn és Healthy Taiwan: agentek és robotok a kórházban

Kép: NVIDIA Newsroom / Foxconn és Healthy Taiwan

A negyedik bejelentés az egészségügy felé viszi tovább ugyanazt a gondolatot. Az NVIDIA szerint a Foxconn és tajvani egészségügyi központok AI-agent munkafolyamatokat, CoDoctor AI platformot és Nurabot ápolási kollaboratív robotokat vezetnek be a Healthy Taiwan kezdeményezés részeként. A program mögött 1,5 milliárd dolláros regionális befektetés áll, és a cél nem egyetlen látványos demo, hanem egy skálázható egészségügyi AI-ökoszisztéma felépítése.

A CoDoctor AI több klinikai területre terjed ki, például mellrákszűrésre, EKG-elemzésre, szemfenéki képalkotásra, koszorúér-CT-re és endoszkópos feladatokra. A Foxconn CoDoClaw rendszere NVIDIA NemoClaw alapokra épül, míg a Nurabot ápolási robotokat az NVIDIA physical AI stackje támogatja. Az NVIDIA szerint a kórházi robotok bevezetését Omniverse-alapú digitális ikrekkel készítik elő, így a rendszereket előbb virtuális kórházi környezetben lehet tesztelni, betanítani és validálni.

A számok itt is érdekesek: a bejelentés szerint a szimuláció-először megközelítés 40 százalékkal csökkentette a bevezetési időt, miközben 98 százalékos navigációs pontosságot tett lehetővé. Ezek gyártói és partneri állítások, tehát érdemes óvatosan kezelni őket, de az irány világos: az NVIDIA szerint a physical AI nem csak gyártósorokon vagy utakon jelenhet meg, hanem kórházi folyosókon, műtőkben és diagnosztikai munkafolyamatokban is.

Miért érdemes ezt egyben nézni?

Azért, mert a öt bejelentés ugyanannak a stratégiának négy rétege. A Cosmos 3 adja az alapmodellt és a synthetic data irányt, az Isaac GR00T referenciarobot a humanoid kutatási hardver-szoftver alapot mutatja meg, az Alpamayo 2 Super pedig azt jelzi, hogyan lehet ezt autonóm járműveknél használni, a TSMC-s együttműködés azt bizonyítja, hogy az AI már a chipgyártási folyamatba is beköltözik, a Foxconnos egészségügyi program pedig azt mutatja, hogy az agentic és physical AI végül emberek mellett dolgozó rendszerekben akar testet ölteni.

Ez nem azt jelenti, hogy holnaptól minden robotaxi biztonságosabb lesz, minden chipgyár gyorsabban épül, és minden kórház robotokkal dolgozik. Sok bejelentés még fejlesztői, partneri vagy bevezetési fázisban van, és a valós teljesítményt csak későbbi, független tapasztalatok fogják igazán megmutatni. De az NVIDIA üzenete egyértelmű: az AI következő nagy csatatere nem csak a chatbotok ablaka lesz, hanem a fizikai világ, ahol az AI-nek már nem elég jól válaszolnia, hanem jól kell érzékelnie, döntenie és cselekednie is.

NVIDIA: a physical AI már humanoid robotot, robotaxit és chipgyárat is jelent