NVIDIA Blackwell pomeo MLPerf Training 6.0

NVIDIA je objavila da je njezina Blackwell platforma postigla najbolje rezultate na svih sedam testova MLPerf Training 6.0. GB300 NVL72 donosi do 1,6× brži trening od GB200 NVL72, a najveća prijava koristila je 8.192 Blackwell GPU-a na DeepSeek-V3 modelu od 671 milijarde parametara. CoreWeave je istrenirao DeepSeek-V3 671B u 2,02 minute na 8.192 GPU-a, dok je Microsoft Azure odradio Llama 3.1 405B u 7,07 minuta.

NVIDIA je objavila rezultate u MLPerf Training 6.0 u kojima je njezina Blackwell platforma postigla najbolje rezultate na svih sedam benchmarka, učvrstivši dominaciju u treniranju velikih modela.

Što je NVIDIA postigla u MLPerf Training 6.0?

NVIDIA je jedina platforma s prijavama na svih sedam benchmarka, uključujući dva nova zadatka pretreniranja MoE (Mixture of Experts) modela. MoE je arhitektura u kojoj se za svaki token aktivira samo dio parametara. Nova generacija GB300 NVL72 donosi do 1,6× brži trening od prethodnog GB200 NVL72. MLPerf Training je industrijski standardni paket testova koji mjeri vrijeme potrebno da se model istrenira do zadane točnosti.

Koliki su bili rezultati na najvećoj skali?

Najveća prijava koristila je 8.192 Blackwell GPU-a na DeepSeek-V3 modelu od 671 milijarde parametara. Na toj skali CoreWeave je istrenirao DeepSeek-V3 671B u 2,02 minute, dok je Microsoft Azure odradio Llama 3.1 405B u 7,07 minuta. Rezultati pokazuju koliko se vrijeme treniranja frontier modela skratilo na masivnim GPU klasterima.

Zašto su ovi rezultati važni?

MLPerf rezultati služe kao neutralna referenca za usporedbu AI hardvera, pa objava utječe na odluke o nabavi u podatkovnim centrima. Sweep na svih sedam testova, uz nove MoE zadatke, signalizira da NVIDIA zadržava prednost upravo na arhitekturama koje pokreću najnovije frontier modele.

Česta pitanja

Što je NVIDIA postigla u MLPerf Training 6.0?

Najbolje rezultate na svih sedam benchmarka; GB300 NVL72 donosi do 1,6× brži trening od GB200 NVL72.

Koliko je GPU-a koristila najveća prijava?

8.192 Blackwell GPU-a na DeepSeek-V3 modelu od 671 milijarde parametara.

Što je MLPerf Training?

Industrijski standard za mjerenje brzine treniranja AI modela, s nizom standardiziranih benchmarka.

NVIDIA: Blackwell pomeo MLPerf Training 6.0 — najbrži na svih 7 benchmarka, GB300 do 1,6× brži

Što je NVIDIA postigla u MLPerf Training 6.0?

Koliki su bili rezultati na najvećoj skali?

Zašto su ovi rezultati važni?

Česta pitanja

Izvori

Povezane vijesti