NVIDIA Blackwell横扫MLPerf Training 6.0基准

NVIDIA宣布其Blackwell平台在MLPerf Training 6.0全部七项测试中取得最佳成绩。GB300 NVL72训练速度比GB200 NVL72最高提升1.6倍，最大规模提交使用8192块Blackwell GPU训练拥有6710亿参数的DeepSeek-V3模型。CoreWeave用8192块GPU在2.02分钟内完成DeepSeek-V3 671B训练，微软Azure用7.07分钟完成Llama 3.1 405B训练。

NVIDIA发布了MLPerf Training 6.0成绩，其Blackwell平台在全部七项基准测试中均取得最佳结果，进一步巩固了在大模型训练领域的主导地位。

NVIDIA在MLPerf Training 6.0中取得了什么成绩？

NVIDIA是唯一一个在全部七项基准测试中均有提交的平台，包括两项全新的MoE（混合专家）模型预训练任务。MoE是一种每次推理只激活部分参数的架构。新一代GB300 NVL72训练速度比上一代GB200 NVL72最高提升1.6倍。MLPerf Training是衡量模型训练至目标精度所需时间的行业标准测试套件。

最大规模下的成绩如何？

最大规模提交使用了8192块Blackwell GPU，训练拥有6710亿参数的DeepSeek-V3模型。在该规模下，CoreWeave用2.02分钟完成DeepSeek-V3 671B训练，微软Azure用7.07分钟完成Llama 3.1 405B训练。这些成绩展示了在大规模GPU集群上前沿模型训练时间的大幅缩短。

为什么这些成绩重要？

MLPerf成绩是AI硬件比较的中立参考，因此发布结果会影响数据中心的采购决策。在全部七项测试（含新增MoE任务）中的全面领先，标志着NVIDIA在驱动最新前沿模型的架构上保持优势。

常见问题

NVIDIA在MLPerf Training 6.0中取得了什么成绩？

在全部七项基准测试中取得最佳成绩；GB300 NVL72训练速度比GB200 NVL72最高提升1.6倍。

最大规模提交使用了多少块GPU？

使用8192块Blackwell GPU训练拥有6710亿参数的DeepSeek-V3模型。

什么是MLPerf Training？

衡量AI模型训练速度的行业标准，包含一系列标准化基准测试。

NVIDIA Blackwell横扫MLPerf Training 6.0 — 7项基准全部第一，GB300速度提升最高1.6倍

NVIDIA在MLPerf Training 6.0中取得了什么成绩？

最大规模下的成绩如何？

为什么这些成绩重要？

常见问题

来源

相关新闻