Az AMD következő generációs Radeon GPU-i várhatóan jelentős frissítést hoznak az RDNA 4-hez képest, és az egyik kihívás, amellyel a cég szembenéz, a kettős utasításpárosítás fejlesztése. Az RDNA 3 óta jelenlévő funkció lehetővé teszi két utasítás egyidejű végrehajtását egy ciklus alatt, de a szigorú párosítási szabályok miatt a fordítók nem mindig tudták kihasználni ezt, ami a teljesítmény korlátozását jelentette.
Egy új LLVM folt szerint az AMD megoldja ezt a problémát az RDNA 5-ben. A Coelacanth’s Dream, egy Linux-központú fórum, megvizsgálta az újításokat, és rájött, hogy ezek a gfx13-ra utalnak, ami az RDNA 5-re vonatkozik. Az AMD egy új utasításformátumot, a „VOPD3”-at vezet be, amely jobban kapcsolódik a kettős utasítású VALU-hoz (Vector Arithmetic Logic Unit; shader egység), ezáltal lehetővé téve, hogy a fordító könnyebben alkalmazza a kettős utasításpárosítást.
A technikai részletek szerint az eddigi rendszer, amelyet VOPD néven ismernek, leginkább csak egyszerűbb, két operandusú utasítással működött, ami megnehezítette a fordítók számára kompatibilis utasításpárok ütemezését. A VOPD3 kiterjeszti ezt a három operandusú utasításokra, így képes támogatni az olyan műveleteket, mint a fúziós szorzás-összeadás (FMA). A V_FMA_F32 kiegészítést az adott lekérés során vezették be, és ebből következtethetünk arra, hogy az RDNA 5-ben is jelen lesz.
Ez lehetővé tenné a kettős utasítású végrehajtást, ami potenciálisan jelentősen növelheti az FP32 áteresztőképességet. A shader egységek kevesebb időt tölthetnek várakozással, és több munkát végezhetnek el, növelve az utasítás hatékonyságát.
Ez jelentős előrelépést jelenthet az olyan igényes feladatok esetében, mint a renderelés, és segíthet a játék motorok optimalizálásában a kettős utasítású VALU-ra. Az ilyen korlátozások miatti sikertelen párosítások számának csökkentése kulcsfontosságú a hardver hatékonyságának növelésében anélkül, hogy a szilíciumon keresztül növelnék az IPC-t.
Forrás: tomshardware