NVIDIAのBlackwellがMLPerf Training 6.0を制覇 — 全7ベンチマーク首位、GB300は最大1.6倍高速
NVIDIAはBlackwellプラットフォームがMLPerf Training 6.0の全7テストで最高成績を達成したと発表しました。GB300 NVL72はGB200 NVL72と比べて最大1.6倍高速なトレーニングを実現し、最大規模の提出では8192基のBlackwell GPUを使用して6710億パラメータのDeepSeek-V3モデルを学習しました。CoreWeaveは8192基のGPUでDeepSeek-V3 671Bを2.02分でトレーニングし、Microsoft AzureはLlama 3.1 405Bを7.07分で完了しました。
この記事はAIにより一次情報源から生成されました。
NVIDIAはMLPerf Training 6.0の結果を発表し、Blackwellプラットフォームが全7ベンチマークで最高成績を達成したことを示しました。これにより大規模モデルトレーニング分野での支配的地位がさらに強固になりました。
NVIDIAはMLPerf Training 6.0で何を達成しましたか?
NVIDIAは全7ベンチマークに提出した唯一のプラットフォームであり、MoE(混合専門家)モデルの事前学習に関する2つの新タスクも含まれています。MoEは各トークンに対してパラメータの一部のみを活性化するアーキテクチャです。新世代のGB300 NVL72は前世代GB200 NVL72と比べて最大1.6倍高速なトレーニングを実現します。MLPerf Trainingは、モデルが目標精度に達するまでの時間を測定する業界標準のテストスイートです。
最大スケールでの結果はどうでしたか?
最大規模の提出では、6710億パラメータのDeepSeek-V3モデルに8192基のBlackwell GPUを使用しました。このスケールでCoreWeaveはDeepSeek-V3 671Bを2.02分でトレーニングし、Microsoft AzureはLlama 3.1 405Bを7.07分で完了しました。これらの結果は、大規模GPUクラスターにおけるフロンティアモデルのトレーニング時間がいかに短縮されているかを示しています。
これらの結果がなぜ重要なのですか?
MLPerfの結果はAIハードウェア比較の中立的な参照指標として機能するため、データセンターの調達判断に影響を与えます。新しいMoEタスクを含む全7テストでの制覇は、最新フロンティアモデルを動かすアーキテクチャでNVIDIAが優位性を維持していることを示しています。
よくある質問
- NVIDIAはMLPerf Training 6.0で何を達成しましたか?
- 全7ベンチマークで最高成績を獲得しました。GB300 NVL72はGB200 NVL72と比べて最大1.6倍高速なトレーニングを実現します。
- 最大規模の提出では何基のGPUを使用しましたか?
- 6710億パラメータのDeepSeek-V3モデルに8192基のBlackwell GPUを使用しました。
- MLPerf Trainingとは何ですか?
- AIモデルのトレーニング速度を測定する業界標準で、標準化されたベンチマーク群で構成されています。