🟡 🔧 Hardware Objavljeno: · 2 min čitanja ·

NVIDIA i AWS: EC2 G7 instance s Blackwell GPU-om donose 4,6× bolji AI inference

Editorial illustration: NVIDIA Blackwell GPU server rack u AWS podatkovnom centru s plavim svjetlosnim efektima

NVIDIA i AWS najavili su EC2 G7 instance s RTX PRO 4500 Blackwell GPU-om koji donosi 4,6× bolji AI inference od prethodne G6 generacije, dok knjižnica cuVS postaje zadana u Amazon OpenSearch Serverlessu s 10× bržim vektorskim indeksiranjem.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

EC2 G7: novi AWS standard za AI inference

Amazon EC2 G7 instance, koje pokreće NVIDIA RTX PRO 4500 Blackwell Server Edition GPU — arhitektura pete generacije namijenjena isključivo inferenci i grafičkim radnim opterećenjima u podatkovnim centrima — postaju novi AWS standard za AI inferenzu (izvođenje zaključivanja treniranog modela u produkciji). U usporedbi s prethodnim G6 instancama, G7 donosi do 4,6× bolji AI inference učinak zahvaljujući naprednoj Blackwell mikroarhitekturi i većoj propusnosti memorije.

Konfiguracija G7 instanci je impresivna: do 8 GPU-a po instanci s ukupno 256 GB GPU memorije, 700 Gbps EFA (Elastic Fabric Adapter) mreže za nisku latenciju između čvorova i 7,6 TB NVMe SSD pohrane. Takva konfiguracija omogućuje pokretanje velikih jezičnih modela i multimodalnih AI aplikacija bez uskih grla u prijenosu podataka.

Zašto je cuVS u OpenSearchu prekretnica?

NVIDIA cuVS (CUDA Vector Search) — knjižnica za GPU-ubrzano vektorsko indeksiranje i semantičko pretraživanje — postala je zadana opcija u Amazon OpenSearch Serverlessu. Vektorsko indeksiranje je postupak pretvorbe tekstualnih, slikovnih ili audio podataka u matematičke vektore koji se mogu brzo pretraživati po semantičkoj sličnosti, što je temelj RAG (Retrieval-Augmented Generation) sustava i modernih AI pretraživača.

Integracijom cuVS-a kao zadane postavke OpenSearch Serverless korisnici automatski dobivaju 10× brže vektorsko indeksiranje uz svega četvrtinu dosadašnje cijene — bez ikakvih promjena u kodu ili konfiguraciji. Ovo je posebno značajno za tvrtke koje grade AI aplikacije s velikim katalozima dokumenata ili produkte temeljene na semantičkom pretraživanju.

AWS dobiva NVIDIA Exemplar Cloud status

Amazon Web Services postigao je NVIDIA Exemplar Cloud status za GB300 treninge — najvišu razinu NVIDIA certifikacije za cloud partnere. Ova oznaka potvrđuje da AWS infrastruktura ispunjava najstrože zahtjeve za treniranje najzahtjevnijih AI modela na NVIDIA GB300 NVL72 klasterima, što AWS pozicionira kao primarnu platformu za korporativne AI projekte velikih razmjera.

Česta pitanja

Što su Amazon EC2 G7 instance i čime se razlikuju od G6?
EC2 G7 instance pokreću NVIDIA RTX PRO 4500 Blackwell Server Edition GPU koji nudi do 4,6× bolji AI inference od prethodnih G6 instanci temeljenih na starijom Ampere/Ada arhitekturi.
Što je NVIDIA cuVS i zašto je važno da postane zadano u OpenSearchu?
cuVS (CUDA Vector Search) je NVIDIA-ina knjižnica za ubrzano vektorsko indeksiranje i pretraživanje na GPU-u; njezinom integracijom kao zadane opcije u Amazon OpenSearch Serverlessu korisnici automatski dobivaju 10× brže indeksiranje uz četvrtinu dosadašnje cijene.