AMD MI355X在MLPerf v6.0中与NVIDIA差距仅5%

AMD在MLPerf Training v6.0中展示了Instinct MI355X在LLM基准测试中与同级NVIDIA GPU性能差距约为5%。MI355X比去年的MI300X快3.5倍，比上一轮快13–19%。AMD首次引入MXFP4（FP4）训练配方和Primus统一框架，并完成了包含512块MI300X GPU、64个节点的多节点提交。

AMD发布了MLPerf Training v6.0成绩，显示其Instinct MI355X在大型语言模型训练的关键基准测试中已接近NVIDIA。

MI355X与NVIDIA的差距有多近？

根据AMD的测量，MI355X在v6.0轮次的两项LLM基准测试中与同级NVIDIA GPU的性能差距约为5%。这是迄今为止最小的差距，标志着AMD正在成为训练领域更具竞争力的替代方案。MLPerf Training是衡量模型训练至目标精度所需时间的标准化测试套件。

与前代相比有多大进步？

MI355X在相同基准测试中比去年的MI300X快3.5倍，比上一轮（v5.1）在Llama 2 70B LoRA和Llama 3.1 8B等任务上快13–19%。AMD首次引入MXFP4训练配方——这种4位格式降低了内存和计算需求——以及全新的Primus统一训练框架。

这对AI硬件市场意味着什么？

多节点提交涵盖了512块MI300X GPU、64个节点（联合OCI），表明AMD也覆盖了本轮的高规模场景。与NVIDIA的MLPerf全面领先同日发布，加剧了竞争：更小的差距和FP4训练使AMD在寻求NVIDIA替代方案的数据中心中更具竞争力。

常见问题

MI355X与NVIDIA的差距有多近？

在MLPerf Training v6.0的两项LLM基准测试中，与同级NVIDIA GPU的性能差距约为5%。

MI355X比前代快多少？

比去年的MI300X快3.5倍，比上一轮（v5.1）快13–19%。

什么是MXFP4？

AMD首次用于训练的4位（FP4）数字格式，可降低内存和计算需求。

AMD：Instinct MI355X在MLPerf Training v6.0中与NVIDIA差距缩至5%，性能比上代提升3.5倍

MI355X与NVIDIA的差距有多近？

与前代相比有多大进步？

这对AI硬件市场意味着什么？

常见问题

来源

相关新闻