AWS EC2 G7 Blackwell: 4,6× schnellere KI-Inferenz

NVIDIA und AWS haben EC2 G7-Instanzen mit RTX PRO 4500 Blackwell-GPU angekündigt, die eine 4,6× bessere KI-Inferenz als die Vorgänger-G6-Generation bieten. Die cuVS-Bibliothek wird zur Standardoption in Amazon OpenSearch Serverless mit 10× schnellerer Vektorindexierung.

EC2 G7: neuer AWS-Standard für KI-Inferenz

Die Amazon EC2 G7-Instanzen, die von der NVIDIA RTX PRO 4500 Blackwell Server Edition GPU — einer Fünftgenerations-Architektur, die ausschließlich für Inferenz und grafische Workloads in Rechenzentren ausgelegt ist — angetrieben werden, werden zum neuen AWS-Standard für KI-Inferenz (das Ausführen von Schlussfolgerungen mit einem trainierten Modell in der Produktion). Im Vergleich zu den bisherigen G6-Instanzen bringt G7 dank der fortschrittlichen Blackwell-Mikroarchitektur und höherer Speicherbandbreite bis zu 4,6× bessere KI-Inferenzleistung.

Die Konfiguration der G7-Instanzen ist beeindruckend: bis zu 8 GPUs pro Instanz mit insgesamt 256 GB GPU-Speicher, 700 Gbps EFA (Elastic Fabric Adapter)-Netzwerk für niedrige Latenz zwischen Knoten und 7,6 TB NVMe-SSD-Speicher. Diese Konfiguration ermöglicht den Betrieb großer Sprachmodelle und multimodaler KI-Anwendungen ohne Engpässe bei der Datenübertragung.

Warum ist cuVS in OpenSearch ein Wendepunkt?

NVIDIA cuVS (CUDA Vector Search) — eine Bibliothek für GPU-beschleunigtes Vektorindexieren und semantisches Suchen — ist als Standardoption in Amazon OpenSearch Serverless integriert worden. Vektorindexierung ist der Prozess, Text-, Bild- oder Audiodaten in mathematische Vektoren umzuwandeln, die schnell nach semantischer Ähnlichkeit durchsucht werden können — die Grundlage von RAG-Systemen (Retrieval-Augmented Generation) und modernen KI-Suchmaschinen.

Durch die Integration von cuVS als Standardeinstellung profitieren OpenSearch Serverless-Nutzer automatisch von 10× schnellerer Vektorindexierung zu nur einem Viertel der bisherigen Kosten — ohne Änderungen am Code oder der Konfiguration. Dies ist besonders bedeutsam für Unternehmen, die KI-Anwendungen mit großen Dokumentenkatalogen oder semantikbasierte Suchprodukte entwickeln.

AWS erhält NVIDIA Exemplar Cloud Status

Amazon Web Services hat den NVIDIA Exemplar Cloud Status für GB300-Training erhalten — die höchste NVIDIA-Zertifizierungsstufe für Cloud-Partner. Diese Auszeichnung bestätigt, dass die AWS-Infrastruktur die strengsten Anforderungen für das Training der anspruchsvollsten KI-Modelle auf NVIDIA GB300 NVL72-Clustern erfüllt, was AWS als primäre Plattform für große KI-Unternehmensvorhaben positioniert.

Häufig gestellte Fragen

Was sind Amazon EC2 G7-Instanzen und wie unterscheiden sie sich von G6?

EC2 G7-Instanzen verwenden die NVIDIA RTX PRO 4500 Blackwell Server Edition GPU und bieten bis zu 4,6× bessere KI-Inferenz als die vorherigen G6-Instanzen auf Basis der älteren Ampere/Ada-Architektur.

Was ist NVIDIA cuVS und warum ist es wichtig, dass es Standard in OpenSearch wird?

cuVS (CUDA Vector Search) ist NVIDIAs Bibliothek für beschleunigtes Vektorindexieren und -suchen auf der GPU; durch ihre Integration als Standardoption in Amazon OpenSearch Serverless profitieren Nutzer automatisch von 10× schnellerer Indexierung zu einem Viertel der bisherigen Kosten.

NVIDIA und AWS: EC2 G7-Instanzen mit Blackwell-GPU bringen 4,6× bessere KI-Inferenz

EC2 G7: neuer AWS-Standard für KI-Inferenz

Warum ist cuVS in OpenSearch ein Wendepunkt?

AWS erhält NVIDIA Exemplar Cloud Status

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten