AMD:Instinct MI355X がMLPerf Training v6.0でNVIDIAとの差を5%に縮小、前世代比3.5倍の性能
AMDはMLPerf Training v6.0でInstinct MI355XがLLMベンチマークにおいて同等のNVIDIA GPUとの性能差が約5%であることを示しました。MI355Xは昨年のMI300Xより3.5倍高速で、前ラウンドより13〜19%高速です。AMDはMXFP4(FP4)トレーニングレシピとPrimusユニファイドフレームワークを初めて導入し、512基のMI300X GPU、64ノードのマルチノード提出も行いました。
この記事はAIにより一次情報源から生成されました。
AMDはMLPerf Training v6.0の結果を発表し、Instinct MI355Xが大規模言語モデルのトレーニングにおける主要ベンチマークでNVIDIAに迫っていることを示しました。
MI355XはNVIDIAにどれだけ近づきましたか?
AMDの測定によると、MI355XはMLPerf Training v6.0の両LLMベンチマークにおいて同等のNVIDIA GPUと約5%以内の性能差に収まっています。これは過去最小の差であり、AMDがトレーニング分野でより有力な代替選択肢になりつつあることを示しています。MLPerf Trainingは、モデルが目標精度に達するまでの時間を測定する標準化されたテストスイートです。
前世代と比べた進歩はどれくらいですか?
MI355Xは同じベンチマークで昨年のMI300Xより3.5倍高速で、前ラウンド(v5.1)のLlama 2 70B LoRAやLlama 3.1 8Bなどのタスクより13〜19%高速です。AMDはメモリと計算要件を削減する4ビットフォーマットのMXFP4トレーニングレシピと、新しいPrimusユニファイドトレーニングフレームワークを初めて導入しました。
これはAIハードウェア市場にとって何を意味しますか?
マルチノード提出には512基のMI300X GPU、64ノード(OCIと共同)が含まれ、AMDが本ラウンドの大規模スケールもカバーしていることを示しています。NVIDIAのMLPerf全面制覇と同日の発表は競争を激化させています。差の縮小とFP4トレーニングにより、NVIDIAの代替を求めるデータセンターにとってAMDはより競争力のある選択肢となっています。
よくある質問
- MI355XはNVIDIAにどれだけ近づきましたか?
- MLPerf Training v6.0の両LLMベンチマークにおいて、同等のNVIDIA GPUと約5%以内の性能差に収まっています。
- MI355Xは前世代と比べてどれくらい速いですか?
- 昨年のMI300Xより3.5倍高速で、前ラウンド(v5.1)より13〜19%高速です。
- MXFP4とは何ですか?
- AMDがトレーニングに初めて使用する4ビット(FP4)数値フォーマットで、メモリと計算要件を削減します。