🟡 🔧 하드웨어 게시일: · 2 분 읽기 ·

NVIDIA와 AWS: EC2 G7 Blackwell GPU 인스턴스, AI 추론 4.6배 향상

에디토리얼 일러스트레이션: 파란 조명 효과가 있는 AWS 데이터 센터의 NVIDIA Blackwell GPU 서버 랙

NVIDIA와 AWS가 이전 G6 세대 대비 AI 추론 성능이 4.6배 향상된 RTX PRO 4500 Blackwell GPU를 탑재한 EC2 G7 인스턴스를 발표했습니다. cuVS 라이브러리는 Amazon OpenSearch Serverless의 기본값이 되어 벡터 인덱싱 속도가 10배 빨라졌습니다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.

EC2 G7: AI 추론을 위한 새로운 AWS 표준

NVIDIA RTX PRO 4500 Blackwell Server Edition GPU — 데이터 센터에서의 추론과 그래픽 워크로드를 위한 5세대 아키텍처 — 를 구동하는 Amazon EC2 G7 인스턴스는 AI 추론(프로덕션에서 훈련된 모델 실행)을 위한 새로운 AWS 표준이 됩니다. 이전 G6 인스턴스와 비교하여 G7은 Blackwell 마이크로아키텍처의 발전된 기술과 더 높은 메모리 대역폭 덕분에 최대 4.6배 향상된 AI 추론 성능을 제공합니다.

G7 인스턴스의 구성은 인상적입니다. 인스턴스당 최대 8개 GPU와 총 256GB GPU 메모리, 노드 간 저지연을 위한 700Gbps EFA(Elastic Fabric Adapter) 네트워크, 7.6TB NVMe SSD 스토리지를 갖춥니다. 이러한 구성으로 데이터 전송의 병목 없이 대형 언어 모델과 멀티모달 AI 애플리케이션을 실행할 수 있습니다.

OpenSearch에서 cuVS가 전환점인 이유는?

NVIDIA cuVS(CUDA Vector Search) — GPU 가속 벡터 인덱싱 및 의미론적 검색을 위한 라이브러리 — 가 Amazon OpenSearch Serverless의 기본 옵션이 되었습니다. 벡터 인덱싱은 텍스트, 이미지, 오디오 데이터를 의미론적 유사성으로 빠르게 검색할 수 있는 수학적 벡터로 변환하는 과정으로, RAG(Retrieval-Augmented Generation) 시스템과 현대 AI 검색 엔진의 기반입니다.

cuVS를 기본 설정으로 통합함으로써 OpenSearch Serverless 사용자는 코드나 구성 변경 없이 자동으로 10배 빠른 벡터 인덱싱을 이전 비용의 4분의 1로 얻게 됩니다. 이는 대규모 문서 카탈로그를 기반으로 AI 애플리케이션을 구축하거나 의미론적 검색 기반 제품을 개발하는 기업에게 특히 중요합니다.

AWS, NVIDIA Exemplar Cloud 지위 획득

Amazon Web Services는 GB300 학습에 대한 NVIDIA Exemplar Cloud 지위를 달성했습니다. 이는 클라우드 파트너를 위한 최고 수준의 NVIDIA 인증입니다. 이 인증은 AWS 인프라가 NVIDIA GB300 NVL72 클러스터에서 가장 까다로운 AI 모델을 학습하기 위한 가장 엄격한 요건을 충족한다는 것을 확인하며, AWS를 대규모 기업 AI 프로젝트를 위한 주요 플랫폼으로 자리매김시킵니다.

자주 묻는 질문

Amazon EC2 G7 인스턴스란 무엇이며 G6과 어떻게 다릅니까?
EC2 G7 인스턴스는 이전 Ampere/Ada 아키텍처 기반 G6 인스턴스 대비 AI 추론 성능이 최대 4.6배 향상된 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU를 구동합니다.
NVIDIA cuVS란 무엇이며 OpenSearch의 기본값이 되는 것이 왜 중요합니까?
cuVS(CUDA Vector Search)는 GPU 가속 벡터 인덱싱 및 검색을 위한 NVIDIA 라이브러리입니다. Amazon OpenSearch Serverless의 기본 옵션으로 통합됨으로써 사용자는 코드나 구성 변경 없이 자동으로 4분의 1 비용으로 10배 빠른 인덱싱을 얻습니다.