Infrastruktura
Vektorska baza podataka
Specijalizirana baza podataka koja pohranjuje i pretražuje vektorske ugradnje pomoću semantičke sličnosti; temelj suvremenih RAG sustava.
Vektorska baza podataka je sustav za pohranu i pretraživanje visokodimenzionalnih vektora — najčešće ugradnji (embeddings) koje neuronska mreža producira iz teksta, slika, audija ili koda. Umjesto klasične pretrage po točnoj jednakosti ili ključnim riječima, vektorska baza vraća stavke koje su semantički slične upitu prema metrikama poput kosinusne sličnosti ili euklidske udaljenosti.
Tehnička srž je approximate nearest neighbor (ANN) pretraga uz pomoć indeksa kao što su HNSW, IVF, ScaNN ili DiskANN. Bez ANN-a, traženje među milijunima vektora bilo bi presporo za interaktivne aplikacije.
Zašto je to važno 2024.-2026.:
- Vektorske baze su osnovni gradivni blok retrieval-augmented generation (RAG) sustava — LLM dohvaća relevantne dokumente iz baze prije generiranja odgovora
- Pokreću semantičku pretragu, sustave preporuka, detekciju duplikata i pretragu slika “po značenju”
- Tržište uključuje dedicirane sustave (Pinecone, Weaviate, Qdrant, Milvus, Chroma) i ekstenzije postojećih baza (pgvector za PostgreSQL, Atlas Vector Search za MongoDB, Redis Vector)
Ključne dileme prilikom izbora: managed vs. self-hosted, performanse pretrage vs. trošak, hibridna pretraga (vektor + ključne riječi), filtriranje po metapodacima i podrška za brisanje/ažuriranje. Za većinu RAG projekata pgvector je dobar prvi izbor; specijalizirane baze se isplate na desecima milijuna vektora i strogim latencijskim budžetima.