AMD: ROCm 7.13 bringt MI350P-GPU, Multi-VF-Virtualisierung und TheRock-Paketierung
AMD veröffentlichte am 20. Mai 2026 ROCm 7.13 — eine neue Version seines Open-Source-KI-Compute-Stacks mit Unterstützung für den MI350P-GPU, Virtualisierung mit bis zu 8 isolierten vGPUs je MI300X-Beschleuniger, einem Open-Source-ROCprof-Trace-Decoder und modularer TheRock-Paketierung mit domänenspezifischen SDKs. Validiert auf Ubuntu 26.04 und RHEL 9.6, mit VMware-ESXi-9.1-Support für MI350X und MI355X.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
AMD veröffentlichte am 20. Mai 2026 ROCm 7.13 — eine neue Version seines Open-Source-KI-Compute-Stacks, der als primäre Alternative zum NVIDIA-CUDA-Ökosystem gilt. Das Release bringt Unterstützung für den MI350P-GPU, Multi-VF-Virtualisierung, einen Open-Source-ROCprof-Trace-Decoder und TheRock-Modulpaketierung.
Was bringt ROCm 7.13 für die Enterprise-Virtualisierung?
Die größte Enterprise-Neuheit ist die Multi-VF (Virtual Function)-Unterstützung: bis zu 8 isolierte vGPUs je MI300X-Beschleuniger. Damit können mehrere Tenants oder Modelle dieselbe Hardware mit Memory-Isolation teilen — eine kritische Anforderung für Multi-Tenant-Cloud-Anbieter und On-Prem-KI-Plattformen, die eine bessere Auslastung teurer Beschleuniger anstreben. Die Integration mit VMware ESXi 9.1 erweitert die Anwendbarkeit auf MI350X- und MI355X-Modelle.
Warum ist der Open-Source-ROCprof-Trace-Decoder wichtig?
Performance-Profiling war lange ein Bereich, in dem AMD hinter NVIDIAs Nsight Systems zurückblieb. ROCm 7.13 führt einen Open-Source-ROCprof-Trace-Decoder ein, der transparente Einblicke in GPU-Instruktionen, Memory-Traffic und Kernel-Latenz bietet. Die Open-Source-Natur ermöglicht es Dritten (z. B. Hugging Face, MosaicML, dem vLLM-Team), spezialisierte Analysetools darüber aufzubauen und so die Ökosystementwicklung zu beschleunigen.
Was ist TheRock und wie verändert es Deployments?
TheRock ist AMDs neues modulares Paketierungsformat für ROCm. Bisher kam ROCm als monolithischer Stack mit rund 12 GB Installationsgröße. TheRock ermöglicht separate domänenspezifische SDKs für HPC, Computer Vision, Data Science und Life Sciences — Nutzer installieren nur die Komponenten, die sie benötigen. Das reduziert die Installationsgröße, beschleunigt Patch-Zyklen und verkleinert die Angriffsfläche.
Validierung und Unterstützung
ROCm 7.13 wurde auf Ubuntu 26.04 und Red Hat Enterprise Linux 9.6 validiert. AMD veröffentlichte gleichzeitig ein Update der QuickReduce-Bibliothek mit FP4-Quantisierung für MI355-GPUs — mit der Behauptung einer 4,1-fachen Beschleunigung gegenüber Standard-RCCL bei Multi-GPU-Kommunikation größerer Nachrichten, was den Performance-Abstand zu CUDA weiter verringert.
Häufig gestellte Fragen
- Was ist neu am MI350P-GPU?
- Der MI350P ist ein neuer AMD-KI-Beschleuniger der Instinct-Linie, optimiert für Inferenz- und Fine-Tuning-Workloads. Er wird in ROCm 7.13 für Bare-Metal- und Kubernetes-Deployments unterstützt; die Integration mit VMware ESXi 9.1 ermöglicht Enterprise-Virtualisierung.
- Was ermöglicht Multi-VF-Virtualisierung konkret?
- Multi-VF (Virtual Function) erlaubt bis zu 8 isolierte virtuelle GPUs je MI300X-Beschleuniger. Damit können mehrere Tenants oder Modelle dieselbe Hardware mit Memory-Isolation teilen — entscheidend für Multi-Tenant-Cloud- und On-Prem-KI-Plattformen.
- Was ist TheRock und warum ist es wichtig?
- TheRock ist AMDs neues modulares Paketierungsformat für ROCm mit optionalen domänenspezifischen SDKs — separate Pakete für HPC, Computer Vision, Data Science und Life Sciences. Das reduziert Installationsgröße und Verwaltungsaufwand, da Nutzer nur installieren, was sie brauchen.
Quellen
Verwandte Nachrichten
AMD ROCm: BubbleFence partitioniert Video-Streams mit Embeddings aus Vision-Foundation-Modellen statt Metadaten-Heuristiken
AMD ROCm: Kimi-K2.5 W4A8 und W8A8 Quantisierung auf MI325X über den Quark + FlyDSL + AITER Inferenz-Stack
AMD: Instinct MI355X übertrifft NVIDIA B200 bei ComfyUI-Workflows mit PyTorch-Optimierungen in ROCm 7.2.0