AMD:Instinct MI355X在MLPerf Training v6.0中与NVIDIA差距缩至5%,性能比上代提升3.5倍
AMD在MLPerf Training v6.0中展示了Instinct MI355X在LLM基准测试中与同级NVIDIA GPU性能差距约为5%。MI355X比去年的MI300X快3.5倍,比上一轮快13–19%。AMD首次引入MXFP4(FP4)训练配方和Primus统一框架,并完成了包含512块MI300X GPU、64个节点的多节点提交。
本文由人工智能基于一手来源生成。
AMD发布了MLPerf Training v6.0成绩,显示其Instinct MI355X在大型语言模型训练的关键基准测试中已接近NVIDIA。
MI355X与NVIDIA的差距有多近?
根据AMD的测量,MI355X在v6.0轮次的两项LLM基准测试中与同级NVIDIA GPU的性能差距约为5%。这是迄今为止最小的差距,标志着AMD正在成为训练领域更具竞争力的替代方案。MLPerf Training是衡量模型训练至目标精度所需时间的标准化测试套件。
与前代相比有多大进步?
MI355X在相同基准测试中比去年的MI300X快3.5倍,比上一轮(v5.1)在Llama 2 70B LoRA和Llama 3.1 8B等任务上快13–19%。AMD首次引入MXFP4训练配方——这种4位格式降低了内存和计算需求——以及全新的Primus统一训练框架。
这对AI硬件市场意味着什么?
多节点提交涵盖了512块MI300X GPU、64个节点(联合OCI),表明AMD也覆盖了本轮的高规模场景。与NVIDIA的MLPerf全面领先同日发布,加剧了竞争:更小的差距和FP4训练使AMD在寻求NVIDIA替代方案的数据中心中更具竞争力。
常见问题
- MI355X与NVIDIA的差距有多近?
- 在MLPerf Training v6.0的两项LLM基准测试中,与同级NVIDIA GPU的性能差距约为5%。
- MI355X比前代快多少?
- 比去年的MI300X快3.5倍,比上一轮(v5.1)快13–19%。
- 什么是MXFP4?
- AMD首次用于训练的4位(FP4)数字格式,可降低内存和计算需求。