NVIDIAとAWS:EC2 G7インスタンスがBlackwell GPUでAI推論を4.6倍向上
NVIDIAとAWSはRTX PRO 4500 Blackwell GPUを搭載したEC2 G7インスタンスを発表しました。前世代のG6比で4.6倍のAI推論性能を実現し、cuVSライブラリはAmazon OpenSearch Serverlessでデフォルトとなり、ベクター索引作成が10倍高速化されます。
この記事はAIにより一次情報源から生成されました。
EC2 G7:AI推論の新しいAWS標準
NVIDIA RTX PRO 4500 Blackwell Server Edition GPU(データセンターでの推論とグラフィックワークロード専用に設計された第5世代アーキテクチャ)を搭載したAmazon EC2 G7インスタンスは、AI推論(本番環境でのトレーニング済みモデルの推論実行)の新しいAWS標準になりつつあります。前世代のG6インスタンスと比較して、G7は先進的なBlackwellマイクロアーキテクチャとより高いメモリ帯域幅により最大4.6倍のAI推論パフォーマンスを実現します。
G7インスタンスの構成は印象的です。インスタンスあたり最大8基のGPU、合計256GBのGPUメモリ、ノード間の低レイテンシのための700 Gbps EFA(Elastic Fabric Adapter)ネットワーク、7.6 TB NVMe SSDストレージです。このような構成により、データ転送のボトルネックなしに大規模言語モデルとマルチモーダルAIアプリケーションを実行できます。
なぜOpenSearchでのcuVSが画期的なのか?
NVIDIA cuVS(CUDA Vector Search)、つまりGPU高速ベクター索引作成とセマンティック検索のためのライブラリが、Amazon OpenSearch Serverlessのデフォルトオプションになりました。ベクター索引作成は、テキスト・画像・音声データをセマンティックな類似性によって素早く検索できる数学的ベクターに変換するプロセスであり、RAG(Retrieval-Augmented Generation)システムと現代のAI検索エンジンの基盤です。
cuVSをデフォルト設定として統合することで、OpenSearch Serverlessのユーザーはコードや設定を変更することなく、自動的に10倍速いベクター索引作成を従来のコストのわずか4分の1で得られます。これは大規模なドキュメントカタログやセマンティック検索ベースの製品を持つAIアプリケーションを構築する企業にとって特に重要です。
AWSがNVIDIA Exemplar Cloudステータスを取得
Amazon Web ServicesはGB300トレーニングでNVIDIA Exemplar Cloudステータスを取得しました。これはNVIDIA GB300 NVL72クラスターで最も demanding なAIモデルのトレーニングのための最も厳格な要件をAWSインフラが満たすことを確認する、クラウドパートナー向けの最高レベルのNVIDIA認証です。これによりAWSは大規模なエンタープライズAIプロジェクトのプライマリプラットフォームとして位置付けられます。
よくある質問
- Amazon EC2 G7インスタンスとは何か、G6とどう違いますか?
- EC2 G7インスタンスはNVIDIA RTX PRO 4500 Blackwell Server Edition GPUを搭載しており、旧いAmpere/Adaアーキテクチャベースの前世代G6インスタンスより最大4.6倍優れたAI推論を提供します。
- NVIDIA cuVSとは何か、またOpenSearchでデフォルトになることがなぜ重要ですか?
- cuVS(CUDA Vector Search)はGPUでの高速ベクター索引作成と検索のためのNVIDIAライブラリです。Amazon OpenSearch Serverlessでデフォルトオプションとして統合されることで、ユーザーはコードや設定を変更することなく自動的に10倍速い索引作成を4分の1のコストで得られます。