AMD:Instinct MI355X가 MLPerf Training v6.0에서 NVIDIA와 5% 차이, 전세대 대비 3.5배 성능 향상
AMD는 MLPerf Training v6.0에서 Instinct MI355X가 LLM 벤치마크에서 동급 NVIDIA GPU와 약 5% 성능 차이를 보였음을 공개했습니다. MI355X는 작년 MI300X보다 3.5배, 이전 라운드보다 13~19% 빠릅니다. AMD는 최초로 MXFP4(FP4) 학습 레시피와 Primus 통합 프레임워크를 도입했으며, 512개 MI300X GPU, 64개 노드의 멀티노드 제출도 완료했습니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
AMD가 MLPerf Training v6.0 결과를 발표했으며, Instinct MI355X가 대형 언어 모델 학습의 주요 벤치마크에서 NVIDIA에 근접했음을 보여줍니다.
MI355X는 NVIDIA에 얼마나 가까워졌습니까?
AMD의 측정에 따르면, MI355X는 v6.0 라운드의 두 LLM 벤치마크에서 동급 NVIDIA GPU와 약 5% 이내의 성능 차이를 기록했습니다. 이는 지금까지 가장 좁은 격차로, AMD가 학습 분야에서 더 유력한 대안으로 부상하고 있음을 나타냅니다. MLPerf Training은 모델이 목표 정확도에 도달하는 데 필요한 시간을 측정하는 표준화된 테스트 스위트입니다.
전세대 대비 얼마나 향상되었습니까?
MI355X는 동일한 벤치마크에서 작년 MI300X보다 3.5배 빠르고, 이전 라운드(v5.1)의 Llama 2 70B LoRA 및 Llama 3.1 8B 등의 작업에서 13~19% 빠릅니다. AMD는 메모리 및 연산 요구사항을 줄이는 4비트 형식의 MXFP4 학습 레시피와 새로운 Primus 통합 학습 프레임워크를 최초로 도입했습니다.
AI 하드웨어 시장에 어떤 의미가 있습니까?
멀티노드 제출에는 512개의 MI300X GPU, 64개 노드(OCI와 공동)가 포함되어 AMD가 이번 라운드의 고규모 시나리오도 커버함을 보여줍니다. NVIDIA의 MLPerf 전면 우위 발표와 같은 날 공개되면서 경쟁이 심화되고 있습니다. 줄어든 격차와 FP4 학습은 NVIDIA 스택의 대안을 찾는 데이터센터에서 AMD를 더 경쟁력 있는 선택지로 만듭니다.
자주 묻는 질문
- MI355X는 NVIDIA에 얼마나 가까워졌습니까?
- MLPerf Training v6.0의 두 LLM 벤치마크에서 동급 NVIDIA GPU와 약 5% 이내의 성능 차이를 기록했습니다.
- MI355X는 전세대보다 얼마나 빠릅니까?
- 작년 MI300X보다 3.5배 빠르고, 이전 라운드(v5.1)보다 13~19% 빠릅니다.
- MXFP4란 무엇입니까?
- AMD가 학습에 처음 사용하는 4비트(FP4) 숫자 형식으로, 메모리 및 연산 요구사항을 줄여줍니다.