NVIDIA und AWS: EC2 G7-Instanzen mit Blackwell-GPU bringen 4,6× bessere KI-Inferenz
NVIDIA und AWS haben EC2 G7-Instanzen mit RTX PRO 4500 Blackwell-GPU angekündigt, die eine 4,6× bessere KI-Inferenz als die Vorgänger-G6-Generation bieten. Die cuVS-Bibliothek wird zur Standardoption in Amazon OpenSearch Serverless mit 10× schnellerer Vektorindexierung.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
EC2 G7: neuer AWS-Standard für KI-Inferenz
Die Amazon EC2 G7-Instanzen, die von der NVIDIA RTX PRO 4500 Blackwell Server Edition GPU — einer Fünftgenerations-Architektur, die ausschließlich für Inferenz und grafische Workloads in Rechenzentren ausgelegt ist — angetrieben werden, werden zum neuen AWS-Standard für KI-Inferenz (das Ausführen von Schlussfolgerungen mit einem trainierten Modell in der Produktion). Im Vergleich zu den bisherigen G6-Instanzen bringt G7 dank der fortschrittlichen Blackwell-Mikroarchitektur und höherer Speicherbandbreite bis zu 4,6× bessere KI-Inferenzleistung.
Die Konfiguration der G7-Instanzen ist beeindruckend: bis zu 8 GPUs pro Instanz mit insgesamt 256 GB GPU-Speicher, 700 Gbps EFA (Elastic Fabric Adapter)-Netzwerk für niedrige Latenz zwischen Knoten und 7,6 TB NVMe-SSD-Speicher. Diese Konfiguration ermöglicht den Betrieb großer Sprachmodelle und multimodaler KI-Anwendungen ohne Engpässe bei der Datenübertragung.
Warum ist cuVS in OpenSearch ein Wendepunkt?
NVIDIA cuVS (CUDA Vector Search) — eine Bibliothek für GPU-beschleunigtes Vektorindexieren und semantisches Suchen — ist als Standardoption in Amazon OpenSearch Serverless integriert worden. Vektorindexierung ist der Prozess, Text-, Bild- oder Audiodaten in mathematische Vektoren umzuwandeln, die schnell nach semantischer Ähnlichkeit durchsucht werden können — die Grundlage von RAG-Systemen (Retrieval-Augmented Generation) und modernen KI-Suchmaschinen.
Durch die Integration von cuVS als Standardeinstellung profitieren OpenSearch Serverless-Nutzer automatisch von 10× schnellerer Vektorindexierung zu nur einem Viertel der bisherigen Kosten — ohne Änderungen am Code oder der Konfiguration. Dies ist besonders bedeutsam für Unternehmen, die KI-Anwendungen mit großen Dokumentenkatalogen oder semantikbasierte Suchprodukte entwickeln.
AWS erhält NVIDIA Exemplar Cloud Status
Amazon Web Services hat den NVIDIA Exemplar Cloud Status für GB300-Training erhalten — die höchste NVIDIA-Zertifizierungsstufe für Cloud-Partner. Diese Auszeichnung bestätigt, dass die AWS-Infrastruktur die strengsten Anforderungen für das Training der anspruchsvollsten KI-Modelle auf NVIDIA GB300 NVL72-Clustern erfüllt, was AWS als primäre Plattform für große KI-Unternehmensvorhaben positioniert.
Häufig gestellte Fragen
- Was sind Amazon EC2 G7-Instanzen und wie unterscheiden sie sich von G6?
- EC2 G7-Instanzen verwenden die NVIDIA RTX PRO 4500 Blackwell Server Edition GPU und bieten bis zu 4,6× bessere KI-Inferenz als die vorherigen G6-Instanzen auf Basis der älteren Ampere/Ada-Architektur.
- Was ist NVIDIA cuVS und warum ist es wichtig, dass es Standard in OpenSearch wird?
- cuVS (CUDA Vector Search) ist NVIDIAs Bibliothek für beschleunigtes Vektorindexieren und -suchen auf der GPU; durch ihre Integration als Standardoption in Amazon OpenSearch Serverless profitieren Nutzer automatisch von 10× schnellerer Indexierung zu einem Viertel der bisherigen Kosten.
Verwandte Nachrichten
AMD: ATOM-Optimizer — DP Attention und Two-Batch Overlap für DeepSeek-V4 auf MI355X
OpenAI: Jalapeño — eigener ASIC-Chip für LLM-Inferenz, um die Abhängigkeit von NVIDIA zu reduzieren
AMD ROCm: EAGLE3 Speculative Decoding beschleunigt Kimi-K2.5 um 33 % auf MI325X