🟡 🔧 硬件 发布于: · 1 分钟阅读 ·

NVIDIA Blackwell横扫MLPerf Training 6.0 — 7项基准全部第一,GB300速度提升最高1.6倍

编辑配图:NVIDIA Blackwell GPU集群用于AI模型训练

NVIDIA宣布其Blackwell平台在MLPerf Training 6.0全部七项测试中取得最佳成绩。GB300 NVL72训练速度比GB200 NVL72最高提升1.6倍,最大规模提交使用8192块Blackwell GPU训练拥有6710亿参数的DeepSeek-V3模型。CoreWeave用8192块GPU在2.02分钟内完成DeepSeek-V3 671B训练,微软Azure用7.07分钟完成Llama 3.1 405B训练。

🤖

本文由人工智能基于一手来源生成。

NVIDIA发布了MLPerf Training 6.0成绩,其Blackwell平台在全部七项基准测试中均取得最佳结果,进一步巩固了在大模型训练领域的主导地位。

NVIDIA在MLPerf Training 6.0中取得了什么成绩?

NVIDIA是唯一一个在全部七项基准测试中均有提交的平台,包括两项全新的MoE(混合专家)模型预训练任务。MoE是一种每次推理只激活部分参数的架构。新一代GB300 NVL72训练速度比上一代GB200 NVL72最高提升1.6倍。MLPerf Training是衡量模型训练至目标精度所需时间的行业标准测试套件。

最大规模下的成绩如何?

最大规模提交使用了8192块Blackwell GPU,训练拥有6710亿参数的DeepSeek-V3模型。在该规模下,CoreWeave用2.02分钟完成DeepSeek-V3 671B训练,微软Azure用7.07分钟完成Llama 3.1 405B训练。这些成绩展示了在大规模GPU集群上前沿模型训练时间的大幅缩短。

为什么这些成绩重要?

MLPerf成绩是AI硬件比较的中立参考,因此发布结果会影响数据中心的采购决策。在全部七项测试(含新增MoE任务)中的全面领先,标志着NVIDIA在驱动最新前沿模型的架构上保持优势。

常见问题

NVIDIA在MLPerf Training 6.0中取得了什么成绩?
在全部七项基准测试中取得最佳成绩;GB300 NVL72训练速度比GB200 NVL72最高提升1.6倍。
最大规模提交使用了多少块GPU?
使用8192块Blackwell GPU训练拥有6710亿参数的DeepSeek-V3模型。
什么是MLPerf Training?
衡量AI模型训练速度的行业标准,包含一系列标准化基准测试。