🟢 🔧 Hardware Objavljeno: · 1 min čitanja ·

AMD: ROCm optimizacija Matrix3D-a za 3D svjetove ubrzala renderiranje do 54 posto na Instinct GPU-ima

Urednička ilustracija: proceduralno generiran 3D krajolik izranja iz GPU jezgre

AMD je na ROCm blogu opisao optimizaciju okvira Matrix3D za generiranje istraživih 3D svjetova na AMD Instinct GPU-ima. Zamjenom CUDA-specifičnih komponenti Triton kernelima i korištenjem biblioteke gsplat za 3DGS, renderiranje je na GPU-u MI250 ubrzano za 54 posto, a na MI300 za 50 posto, dok je sam rendering kernel 36 posto brži od CUDA verzije.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

AMD je na ROCm blogu opisao optimizaciju okvira Matrix3D za generiranje istraživih 3D svjetova na AMD Instinct GPU-ima. ROCm je AMD-ov softverski stack za GPU računanje, izravni konkurent NVIDIA-inoj CUDA platformi, pa je prenošenje AI radnih opterećenja na ROCm važno za smanjenje ovisnosti o jednom dobavljaču.

Što je promijenjeno

Inženjeri su CUDA-specifične komponente zamijenili Triton kernelima — prijenosnim niskorazinskim kodom za GPU — i iskoristili biblioteku gsplat za 3DGS (3D Gaussian Splatting), tehniku rekonstrukcije 3D scena iz slika. Time je optimizacija prilagođena AMD hardveru bez oslanjanja na NVIDIA-in zatvoreni ekosustav.

Rezultati u brojkama

Renderiranje je na GPU-u MI250 ubrzano za 54 posto (s 2887 na 1306 sekundi), a na MI300 za 50 posto (s 972 na 482 sekunde). Sam rendering kernel s Tritonom 36 posto je brži od CUDA verzije, dok je 3DGS fitting uz gsplat 66 posto jeftiniji. Tehnologija se pozicionira kao temelj za prostorne i utjelovljene (embodied) AI aplikacije, gdje generiranje 3D okruženja postaje sve traženije.

Česta pitanja

Što je AMD optimizirao?
Optimizirao je okvir Matrix3D za generiranje istraživih 3D svjetova na AMD Instinct GPU-ima, zamjenom CUDA-specifičnih komponenti Triton kernelima i korištenjem biblioteke gsplat.
Koliko je ubrzanje?
Renderiranje je na GPU-u MI250 brže za 54 posto (s 2887 na 1306 sekundi), a na MI300 za 50 posto (s 972 na 482 sekunde); sam rendering kernel je 36 posto brži od CUDA verzije.
Čemu služi 3DGS fitting?
3DGS (3D Gaussian Splatting) rekonstruira 3D scene iz slika; korištenje biblioteke gsplat smanjilo je njegove troškove za 66 posto.