🟡 🔧 Hardware Veröffentlicht: · 1 Min. Lesezeit ·

AMD: Instinct MI355X bei MLPerf Training v6.0 nur 5% hinter NVIDIA, 3,5× schneller als Vorgänger

Redaktionelle Illustration: AMD Instinct MI355X Beschleuniger im Rechenzentrum

AMDs MLPerf Training v6.0 Ergebnisse zeigen, dass der Instinct MI355X auf LLM-Benchmarks innerhalb von etwa 5% der Leistung eines gleichwertigen NVIDIA-GPUs liegt. Der MI355X ist 3,5× schneller als der MI300X des Vorjahres und 13–19% schneller als die vorherige Runde. AMD führte erstmals MXFP4 (FP4)-Trainingsrezepte und das Primus-Unified-Framework ein, zusammen mit einer Mehrknoteneinreichung von 512 MI300X-GPUs auf 64 Knoten.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

AMD veröffentlichte Ergebnisse in MLPerf Training v6.0, die zeigen, dass der Instinct MI355X bei wichtigen Benchmarks für das Training großer Sprachmodelle den Abstand zu NVIDIA verringert hat.

Wie nah ist MI355X an NVIDIA?

Laut AMDs Messungen liegt der MI355X innerhalb von etwa 5% der Leistung eines gleichwertigen NVIDIA-GPUs auf beiden LLM-Benchmarks in Runde v6.0. Dies ist der bislang geringste Rückstand und ein Signal, dass AMD zu einer ernsthafteren Alternative für Trainings-Workloads wird. MLPerf Training ist eine standardisierte Benchmark-Suite, die die Trainingszeit bis zur Zielerreichung misst.

Wie groß ist der Fortschritt gegenüber Vorgängern?

Der MI355X ist 3,5× schneller als der MI300X des Vorjahres auf denselben Benchmarks und 13–19% schneller als die vorherige Runde (v5.1) bei Aufgaben wie Llama 2 70B LoRA und Llama 3.1 8B. AMD führte erstmals MXFP4-Trainingsrezepte ein — ein 4-Bit-Format, das Speicher- und Rechenanforderungen reduziert — sowie das neue Primus Unified-Training-Framework.

Was bedeutet das für den KI-Hardwaremarkt?

Die Mehrknoteneinreichung umfasste 512 MI300X-GPUs auf 64 Knoten (mit OCI), was AMDs Abdeckung auch bei hoher Skalierung zeigt. Die gleichzeitige Veröffentlichung neben NVIDIAs MLPerf-Sweep verschärft den Wettbewerb: Ein geringerer Rückstand und FP4-Training machen AMD in Rechenzentren, die eine Alternative zum NVIDIA-Stack suchen, wettbewerbsfähiger.

Häufig gestellte Fragen

Wie nah ist MI355X an NVIDIA?
Innerhalb von etwa 5% der Leistung eines gleichwertigen NVIDIA-GPUs auf beiden LLM-Benchmarks in MLPerf Training v6.0.
Wie viel schneller ist MI355X als sein Vorgänger?
3,5× schneller als der MI300X des Vorjahres und 13–19% schneller als die vorherige Runde (v5.1).
Was ist MXFP4?
Ein 4-Bit-Zahlenformat (FP4), das AMD erstmals für das Training verwendet, um Speicher- und Rechenanforderungen zu reduzieren.