NVIDIA: Spectrum-X Multipath Reliable Connection wird OCP-Offenstandard für Gigascale-KI-Netzwerke
NVIDIA Spectrum-X Multipath Reliable Connection (MRC) ist ein RDMA-Transportprotokoll, das eine einzelne Verbindung über mehrere Netzwerkpfade verteilt und nun als offene Spezifikation über das Open Compute Project veröffentlicht wurde. MRC ist bereits bei OpenAI, Microsofts Fairwater-Rechenzentrum und Oracles Abilene-Rechenzentrum im Produktionseinsatz und wurde in Zusammenarbeit mit AMD, Broadcom, Intel und Microsoft entwickelt.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
NVIDIA gab am 6. Mai 2026 bekannt, dass Multipath Reliable Connection (MRC), das für die Spectrum-X-Ethernet-Plattform entwickelte RDMA-Transportprotokoll, als offene Spezifikation über das Open Compute Project (OCP) veröffentlicht wurde. Das Protokoll wurde zuvor auf Spectrum-X-Hardware in drei großen KI-Supercomputern produktionsbewährt.
Was ist Multipath Reliable Connection?
MRC ist ein Transportprotokoll, das einer einzelnen RDMA-Verbindung (Remote Direct Memory Access — Zugriff auf den Speicher eines entfernten Rechners ohne CPU-Beteiligung) ermöglicht, den Datenverkehr gleichzeitig über mehrere Netzwerkpfade zu verteilen. NVIDIA nutzt eine Analogie: Statt einer einspurigen Straße legt MRC „ein Straßennetz mit einer Echtzeit-Verkehrs-App” an, die Fahrer um Staus und Sperrungen umleitet.
Technisch liefert das Protokoll hardwarebeschleunigte Fehlererkennung und -umleitung in Mikrosekunden, intelligente Retransmission für schnelle Paketverlust-Recovery sowie feinkörnige Transparenz und Kontrolle des Datenverkehrs für Administratoren.
Wer nutzt MRC bereits im Produktionseinsatz?
Drei große KI-Deployments stützen sich bereits auf MRC:
- OpenAI — nutzt multiplanare Netzwerkdesigns mit MRC in Kombination mit NVIDIAs Blackwell-GPU-Generation. Sachin Katti von OpenAI erklärte, dass „MRCs End-to-End-Ansatz typische Netzwerkverlangsamungen und Unterbrechungen vermeiden ließ”.
- Microsoft — das Fairwater-Rechenzentrum stützt sich auf MRC für Leistung und Energieeffizienz.
- Oracle Cloud Infrastructure — das Abilene-Rechenzentrum nutzt MRC für groß angelegte Frontier-LLM-Deployments.
Alle drei Fälle fallen in die Kategorie der Gigascale-KI-Netzwerke — Cluster, in denen die GPU-Anzahl in die Zehntausende geht und klassische RDMA-Designs durch Hotspots und langsame Fehler-Recovery zu stocken beginnen.
Warum ändert der OCP-Standard das Spiel?
Das Open Compute Project ist ein 2011 gegründetes Industrieforum für offene Rechenzentrumsspezifikationen. Wenn NVIDIA ein Protokoll an OCP spendet, können andere Netzwerkgerätehersteller MRC in eigenen ASICs und Switches implementieren — ohne Lizenzen, ohne Royalties an NVIDIA.
Die MRC-Entwicklung war bereits kollaborativ: NVIDIA nennt AMD, Broadcom, Intel, Microsoft und OpenAI als Mitwirkende an der Spezifikation. Dies verringert das Vendor-Lock-in-Risiko für Hyperscaler, die bereits in Spectrum-X-Switches investiert haben, erheblich.
Was bedeutet das für die KI-Infrastruktur?
Gigascale-KI-Netzwerke waren bislang das Territorium exklusiver NVIDIA-Mellanox-Designs. Die Öffnung der MRC-Spezifikation signalisiert, dass NVIDIA bereit ist, den Standard zu teilen, damit die gesamte Branche schneller skalieren kann — in der Annahme, dass GPU-Verkäufe, nicht Switching-IP, die Haupteinnahmequelle bleiben.
Für Organisationen, die eigene KI-Cluster aufbauen, bedeutet MRC als offener Standard potenziell größere Auswahl bei Switch-Anbietern bei gleichem Leistungsniveau, das OpenAI, Microsoft und Oracle bereits im Produktionseinsatz haben.
Häufig gestellte Fragen
- Was ist Multipath Reliable Connection (MRC)?
- MRC ist ein RDMA-Transportprotokoll, das einer einzelnen RDMA-Verbindung ermöglicht, den Datenverkehr gleichzeitig über mehrere Netzwerkpfade zu verteilen, um Durchsatz, Lastverteilung und Verfügbarkeit in großen KI-Clustern zu verbessern.
- Wer setzt MRC bereits in der Produktion ein?
- OpenAI nutzt es mit der Blackwell-GPU-Generation in multiplanaren Netzwerkdesigns, Microsofts Fairwater-Rechenzentrum stützt sich auf MRC für Leistung und Effizienz, und Oracle Cloud Infrastructure verwendet MRC im Abilene-Rechenzentrum für Frontier-LLM-Deployments.
- Was bedeutet es, dass MRC nun ein offener OCP-Standard ist?
- Im Mai 2026 veröffentlichte NVIDIA MRC als offene Spezifikation über das Open Compute Project, wodurch andere Netzwerkgerätehersteller dasselbe Protokoll implementieren können, nachdem es auf Spectrum-X-Hardware produktionsbewährt wurde.
Verwandte Nachrichten
AMD: FarSkip-Collective beschleunigt MoE-Inferenz um 18–34 % auf AMD-GPUs
ArXiv SAGA: Workflow-atomares GPU-Scheduling für KI-Agenten erreicht 1,64× schnellere Task-Completion auf 64-GPU-Cluster, angenommen auf HPDC 2026
AMD Primus Projection: Werkzeug zur Vorhersage von LLM-Trainingsanforderungen vor dem Start auf Instinct-GPU-Clustern