인프라
벡터 데이터베이스 (vector database)
벡터 임베딩을 저장하고 의미적 유사도에 기반하여 검색하는 전용 데이터베이스로, 현대의 RAG 시스템과 의미 검색 애플리케이션의 핵심 토대입니다.
**벡터 데이터베이스 (vector database)**는 고차원 벡터 — 가장 흔히는 신경망이 텍스트, 이미지, 오디오 또는 코드에서 생성하는 임베딩(embeddings) — 을 저장하고 검색하기 위한 시스템입니다. 정확한 일치나 키워드에 의한 고전적 검색 대신, 벡터 데이터베이스는 코사인 유사도나 유클리드 거리 같은 메트릭에 따라 쿼리에 대해 의미적으로 유사한 항목을 반환합니다.
기술적 핵심은 HNSW, IVF, ScaNN, DiskANN 같은 인덱스를 사용한 approximate nearest neighbor (ANN) 검색입니다. ANN 없이는 수백만 개의 벡터들 사이의 검색이 인터랙티브 애플리케이션에는 너무 느릴 것입니다.
2024-2026년에 왜 중요한가:
- 벡터 데이터베이스는 retrieval-augmented generation (RAG) 시스템의 기본 빌딩 블록입니다 — LLM은 응답 생성 전에 데이터베이스에서 관련 문서를 검색합니다
- 의미 검색, 추천 시스템, 중복 탐지, “의미에 의한” 이미지 검색을 구동합니다
- 시장은 전용 시스템(Pinecone, Weaviate, Qdrant, Milvus, Chroma)과 기존 데이터베이스의 확장(PostgreSQL용 pgvector, MongoDB용 Atlas Vector Search, Redis Vector)을 모두 포함합니다
선택 시 주요 딜레마: 매니지드 vs. 셀프 호스팅, 검색 성능 vs. 비용, 하이브리드 검색(벡터 + 키워드), 메타데이터 필터링, 삭제/업데이트 지원. 대부분의 RAG 프로젝트의 경우 pgvector가 좋은 첫 선택입니다. 전용 데이터베이스는 수천만 개의 벡터와 엄격한 지연 시간 예산에서 가치가 있습니다.