NVIDIA: Blackwell pomeo MLPerf Training 6.0 — najbrži na svih 7 benchmarka, GB300 do 1,6× brži
NVIDIA je objavila da je njezina Blackwell platforma postigla najbolje rezultate na svih sedam testova MLPerf Training 6.0. GB300 NVL72 donosi do 1,6× brži trening od GB200 NVL72, a najveća prijava koristila je 8.192 Blackwell GPU-a na DeepSeek-V3 modelu od 671 milijarde parametara. CoreWeave je istrenirao DeepSeek-V3 671B u 2,02 minute na 8.192 GPU-a, dok je Microsoft Azure odradio Llama 3.1 405B u 7,07 minuta.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
NVIDIA je objavila rezultate u MLPerf Training 6.0 u kojima je njezina Blackwell platforma postigla najbolje rezultate na svih sedam benchmarka, učvrstivši dominaciju u treniranju velikih modela.
Što je NVIDIA postigla u MLPerf Training 6.0?
NVIDIA je jedina platforma s prijavama na svih sedam benchmarka, uključujući dva nova zadatka pretreniranja MoE (Mixture of Experts) modela. MoE je arhitektura u kojoj se za svaki token aktivira samo dio parametara. Nova generacija GB300 NVL72 donosi do 1,6× brži trening od prethodnog GB200 NVL72. MLPerf Training je industrijski standardni paket testova koji mjeri vrijeme potrebno da se model istrenira do zadane točnosti.
Koliki su bili rezultati na najvećoj skali?
Najveća prijava koristila je 8.192 Blackwell GPU-a na DeepSeek-V3 modelu od 671 milijarde parametara. Na toj skali CoreWeave je istrenirao DeepSeek-V3 671B u 2,02 minute, dok je Microsoft Azure odradio Llama 3.1 405B u 7,07 minuta. Rezultati pokazuju koliko se vrijeme treniranja frontier modela skratilo na masivnim GPU klasterima.
Zašto su ovi rezultati važni?
MLPerf rezultati služe kao neutralna referenca za usporedbu AI hardvera, pa objava utječe na odluke o nabavi u podatkovnim centrima. Sweep na svih sedam testova, uz nove MoE zadatke, signalizira da NVIDIA zadržava prednost upravo na arhitekturama koje pokreću najnovije frontier modele.
Česta pitanja
- Što je NVIDIA postigla u MLPerf Training 6.0?
- Najbolje rezultate na svih sedam benchmarka; GB300 NVL72 donosi do 1,6× brži trening od GB200 NVL72.
- Koliko je GPU-a koristila najveća prijava?
- 8.192 Blackwell GPU-a na DeepSeek-V3 modelu od 671 milijarde parametara.
- Što je MLPerf Training?
- Industrijski standard za mjerenje brzine treniranja AI modela, s nizom standardiziranih benchmarka.
Povezane vijesti
AMD: Instinct MI355X u MLPerf Training v6.0 na 5% zaostatka za NVIDIA-om, 3,5× brži od prošle generacije
AMD: Novi ATOM inference engine za Instinct GPU-e donosi OpenAI-kompatibilan API i MoE optimizacije
AMD: Alibabin ROLL framework radi nativno na Instinct GPU-ovima