NVIDIA Blackwell이 MLPerf Training 6.0 석권 — 7개 벤치마크 전부 1위, GB300 최대 1.6배 빠른 성능
NVIDIA는 Blackwell 플랫폼이 MLPerf Training 6.0의 전체 7개 테스트에서 최고 성적을 달성했다고 발표했습니다. GB300 NVL72는 GB200 NVL72 대비 최대 1.6배 빠른 학습 속도를 제공하며, 최대 규모 제출에서는 8192개의 Blackwell GPU로 6710억 파라미터의 DeepSeek-V3 모델을 학습했습니다. CoreWeave는 8192개 GPU로 DeepSeek-V3 671B를 2.02분에 학습했고, Microsoft Azure는 Llama 3.1 405B를 7.07분에 완료했습니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
NVIDIA가 MLPerf Training 6.0 결과를 발표했으며, Blackwell 플랫폼이 전체 7개 벤치마크에서 최고 성적을 달성하여 대형 모델 학습 분야에서의 지배력을 더욱 공고히 했습니다.
NVIDIA는 MLPerf Training 6.0에서 무엇을 달성했습니까?
NVIDIA는 전체 7개 벤치마크에 제출한 유일한 플랫폼으로, MoE(혼합 전문가) 모델 사전 학습에 관한 2개의 신규 과제도 포함됩니다. MoE는 각 토큰에 대해 파라미터의 일부만 활성화하는 아키텍처입니다. 신세대 GB300 NVL72는 이전 세대 GB200 NVL72 대비 최대 1.6배 빠른 학습 속도를 제공합니다. MLPerf Training은 모델이 목표 정확도에 도달하는 데 필요한 시간을 측정하는 업계 표준 테스트 스위트입니다.
최대 규모에서의 성적은 어떠했습니까?
최대 규모 제출에서는 6710억 파라미터의 DeepSeek-V3 모델에 8192개의 Blackwell GPU를 사용했습니다. 이 규모에서 CoreWeave는 DeepSeek-V3 671B를 2.02분에 학습했고, Microsoft Azure는 Llama 3.1 405B를 7.07분에 완료했습니다. 이 결과들은 대규모 GPU 클러스터에서 프론티어 모델의 학습 시간이 얼마나 단축되었는지를 보여줍니다.
이 결과들이 왜 중요합니까?
MLPerf 결과는 AI 하드웨어 비교의 중립적인 기준으로 기능하므로, 발표 내용이 데이터센터의 구매 결정에 영향을 미칩니다. 신규 MoE 과제를 포함한 전체 7개 테스트에서의 완전한 우위는 NVIDIA가 최신 프론티어 모델을 구동하는 아키텍처에서 경쟁 우위를 유지하고 있음을 시사합니다.
자주 묻는 질문
- NVIDIA는 MLPerf Training 6.0에서 무엇을 달성했습니까?
- 전체 7개 벤치마크에서 최고 성적을 달성했습니다. GB300 NVL72는 GB200 NVL72 대비 최대 1.6배 빠른 학습 속도를 제공합니다.
- 최대 규모 제출에서 몇 개의 GPU를 사용했습니까?
- 6710억 파라미터의 DeepSeek-V3 모델에 8192개의 Blackwell GPU를 사용했습니다.
- MLPerf Training이란 무엇입니까?
- AI 모델 학습 속도를 측정하는 업계 표준으로, 표준화된 벤치마크 모음으로 구성되어 있습니다.