NVIDIA Blackwell dominiert MLPerf Training 6.0

NVIDIA gab bekannt, dass ihre Blackwell-Plattform auf allen sieben Tests des MLPerf Training 6.0 die besten Ergebnisse erzielt hat. GB300 NVL72 bietet bis zu 1,6× schnelleres Training als GB200 NVL72. Die größte Einreichung nutzte 8.192 Blackwell-GPUs am DeepSeek-V3-Modell mit 671 Milliarden Parametern. CoreWeave trainierte DeepSeek-V3 671B in 2,02 Minuten auf 8.192 GPUs, Microsoft Azure schloss Llama 3.1 405B in 7,07 Minuten ab.

NVIDIA veröffentlichte Ergebnisse im MLPerf Training 6.0, bei dem die Blackwell-Plattform auf allen sieben Benchmarks die besten Ergebnisse erzielte und die Dominanz im Training großer Modelle festigte.

Was hat NVIDIA bei MLPerf Training 6.0 erreicht?

NVIDIA ist die einzige Plattform mit Einreichungen auf allen sieben Benchmarks, darunter zwei neue MoE-Vortrainingsaufgaben (Mixture of Experts). MoE ist eine Architektur, bei der pro Token nur ein Teil der Parameter aktiviert wird. Die neue Generation GB300 NVL72 bietet bis zu 1,6× schnelleres Training als das vorherige GB200 NVL72. MLPerf Training ist eine branchenstandard-Benchmark-Suite, die die Trainingszeit bis zur Zielerreichung misst.

Wie waren die Ergebnisse im größten Maßstab?

Die größte Einreichung nutzte 8.192 Blackwell-GPUs am DeepSeek-V3-Modell mit 671 Milliarden Parametern. In diesem Maßstab trainierte CoreWeave DeepSeek-V3 671B in 2,02 Minuten, während Microsoft Azure Llama 3.1 405B in 7,07 Minuten abschloss. Die Ergebnisse zeigen, wie stark sich die Trainingszeiten für Frontier-Modelle auf massiven GPU-Clustern verkürzt haben.

Warum sind diese Ergebnisse wichtig?

MLPerf-Ergebnisse dienen als neutrale Referenz für den Vergleich von KI-Hardware und beeinflussen Beschaffungsentscheidungen in Rechenzentren. Ein Sweep aller sieben Tests, einschließlich der neuen MoE-Aufgaben, signalisiert, dass NVIDIA ihren Vorsprung genau bei den Architekturen beibehält, die die neuesten Frontier-Modelle antreiben.

Häufig gestellte Fragen

Was hat NVIDIA bei MLPerf Training 6.0 erreicht?

Beste Ergebnisse auf allen sieben Benchmarks; GB300 NVL72 bietet bis zu 1,6× schnelleres Training als GB200 NVL72.

Wie viele GPUs nutzte die größte Einreichung?

8.192 Blackwell-GPUs am DeepSeek-V3-Modell mit 671 Milliarden Parametern.

Was ist MLPerf Training?

Eine Branchen-Benchmark-Suite, die die KI-Modell-Trainingsgeschwindigkeit anhand standardisierter Aufgaben misst.

NVIDIA: Blackwell dominiert MLPerf Training 6.0 — schnellster auf allen 7 Benchmarks, GB300 bis zu 1,6× schneller

Was hat NVIDIA bei MLPerf Training 6.0 erreicht?

Wie waren die Ergebnisse im größten Maßstab?

Warum sind diese Ergebnisse wichtig?

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten