Infrastruktura

Reranking

Drugi prolaz pretraživanja koji preuređuje dohvaćene kandidate po relevantnosti, najčešće cross-encoder modelom, radi točnijih RAG i pretraživačkih rezultata.

Reranking (reranking) je drugi korak pretraživanja koji preuređuje listu dohvaćenih kandidata po procijenjenoj relevantnosti za upit. Prvi prolaz — obično pretraga po vektorskoj bazi ili ključnim riječima — brzo vrati desetke do stotine mogućih dokumenata, ali grubo rangiranih; reranking ih precizno presloži i zadrži samo nekoliko najboljih.

Ključna razlika je u modelu. Početni dohvat koristi bi-encoder koji upit i dokument embeddira odvojeno, pa je brz ali manje točan. Reranker je tipično cross-encoder: upit i dokument prolaze kroz model zajedno, što omogućuje izravnu pažnju među njihovim tokenima i daje znatno kalibriraniju ocjenu relevantnosti. Cijena je viša inferencija, pa se rerankira samo uži skup kandidata.

Tijekom 2025.–2026. reranking je standardna komponenta produkcijskih RAG cjevovoda jer mjerljivo podiže točnost dohvata uz malu dodatnu latenciju. Komercijalni modeli (Cohere Rerank, Jina, Voyage) i open-weight rerankeri (BGE, FlashRank) čine ga lako dostupnim.

Izvori

Vidi također