AMD: ROCm optimizacija Matrix3D-a za 3D svjetove ubrzala renderiranje do 54 posto na Instinct GPU-ima
AMD je na ROCm blogu opisao optimizaciju okvira Matrix3D za generiranje istraživih 3D svjetova na AMD Instinct GPU-ima. Zamjenom CUDA-specifičnih komponenti Triton kernelima i korištenjem biblioteke gsplat za 3DGS, renderiranje je na GPU-u MI250 ubrzano za 54 posto, a na MI300 za 50 posto, dok je sam rendering kernel 36 posto brži od CUDA verzije.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
AMD je na ROCm blogu opisao optimizaciju okvira Matrix3D za generiranje istraživih 3D svjetova na AMD Instinct GPU-ima. ROCm je AMD-ov softverski stack za GPU računanje, izravni konkurent NVIDIA-inoj CUDA platformi, pa je prenošenje AI radnih opterećenja na ROCm važno za smanjenje ovisnosti o jednom dobavljaču.
Što je promijenjeno
Inženjeri su CUDA-specifične komponente zamijenili Triton kernelima — prijenosnim niskorazinskim kodom za GPU — i iskoristili biblioteku gsplat za 3DGS (3D Gaussian Splatting), tehniku rekonstrukcije 3D scena iz slika. Time je optimizacija prilagođena AMD hardveru bez oslanjanja na NVIDIA-in zatvoreni ekosustav.
Rezultati u brojkama
Renderiranje je na GPU-u MI250 ubrzano za 54 posto (s 2887 na 1306 sekundi), a na MI300 za 50 posto (s 972 na 482 sekunde). Sam rendering kernel s Tritonom 36 posto je brži od CUDA verzije, dok je 3DGS fitting uz gsplat 66 posto jeftiniji. Tehnologija se pozicionira kao temelj za prostorne i utjelovljene (embodied) AI aplikacije, gdje generiranje 3D okruženja postaje sve traženije.
Česta pitanja
- Što je AMD optimizirao?
- Optimizirao je okvir Matrix3D za generiranje istraživih 3D svjetova na AMD Instinct GPU-ima, zamjenom CUDA-specifičnih komponenti Triton kernelima i korištenjem biblioteke gsplat.
- Koliko je ubrzanje?
- Renderiranje je na GPU-u MI250 brže za 54 posto (s 2887 na 1306 sekundi), a na MI300 za 50 posto (s 972 na 482 sekunde); sam rendering kernel je 36 posto brži od CUDA verzije.
- Čemu služi 3DGS fitting?
- 3DGS (3D Gaussian Splatting) rekonstruira 3D scene iz slika; korištenje biblioteke gsplat smanjilo je njegove troškove za 66 posto.
Povezane vijesti
AMD: Analiza RoCE mrežnih uzoraka pri treningu velikih jezičnih modela
AMD: Open-source Schola spaja Unreal Engine i učenje pojačanjem za trening robotske ruke na ROCm-u
AMD: Instinct MI355X u MLPerf Training v6.0 na 5% zaostatka za NVIDIA-om, 3,5× brži od prošle generacije