インフラ
ベクトルデータベース(vector database)
ベクトル埋め込みを保存し、意味的類似度に基づいて検索する専用データベースで、現代のRAGシステムやセマンティック検索アプリケーションの中核となる基盤です。
**ベクトルデータベース(vector database)**は、高次元ベクトル — 多くの場合、ニューラルネットワークがテキスト、画像、音声、またはコードから生成する埋め込み(embeddings) — を保存・検索するためのシステムです。完全一致やキーワードによる古典的な検索の代わりに、ベクトルデータベースはコサイン類似度やユークリッド距離のような指標に従って、クエリに対して_意味的に類似した_項目を返します。
技術的な核心は、HNSW、IVF、ScaNN、DiskANNのようなインデックスを使った_approximate nearest neighbor(ANN)_検索です。ANNなしでは、数百万のベクトル間の検索は対話型アプリケーションには遅すぎるでしょう。
2024〜2026年に重要な理由:
- ベクトルデータベースはRetrieval-Augmented Generation(RAG)システムの基本構成要素です — LLMは応答生成前にデータベースから関連文書を取得します
- セマンティック検索、レコメンデーションシステム、重複検出、「意味による」画像検索を駆動します
- 市場は、専用システム(Pinecone、Weaviate、Qdrant、Milvus、Chroma)と、既存データベースの拡張(PostgreSQL用のpgvector、MongoDB用のAtlas Vector Search、Redis Vector)の両方を含みます
選択時の主なジレンマ:マネージドかセルフホストか、検索性能対コスト、ハイブリッド検索(ベクトル+キーワード)、メタデータフィルタリング、削除/更新のサポート。ほとんどのRAGプロジェクトでは、pgvectorが良い最初の選択肢です。専用データベースは、数千万のベクトルや厳しいレイテンシ予算の場合に投資する価値があります。