인프라
리랭킹
검색의 두 번째 단계로, 가져온 후보를 관련도에 따라 재정렬하는 기법. 주로 크로스 인코더를 써서 RAG와 검색 결과를 더 정교하게 만든다.
리랭킹(reranking)은 가져온 후보 목록을 질의에 대한 추정 관련도에 따라 다시 정렬하는 검색의 두 번째 단계다. 첫 단계는 보통 벡터 데이터베이스나 키워드 검색으로, 수십에서 수백 개의 후보 문서를 빠르게 반환하지만 순위는 거칠다. 리랭킹은 이를 정밀하게 재정렬해 가장 관련성 높은 소수만 남긴다.
핵심 차이는 모델에 있다. 초기 검색은 질의와 문서를 따로 임베딩하는 _바이 인코더_를 써서 빠르지만 정확도는 낮다. 리랭커는 대개 _크로스 인코더_로, 질의와 문서를 함께 모델에 통과시켜 둘의 토큰 사이에 직접 어텐션이 작동하게 하므로 훨씬 잘 보정된 관련도 점수를 낸다. 대신 추론 비용이 커지므로 좁게 추린 소수의 후보만 재정렬한다.
2025~2026년에 걸쳐 리랭킹은 운영 환경 RAG 파이프라인의 표준 구성 요소다. 적은 추가 지연으로 검색 정확도를 측정 가능하게 끌어올리기 때문이며, 상용 모델(Cohere Rerank, Jina, Voyage)과 오픈 웨이트 리랭커(BGE, FlashRank)로 손쉽게 쓸 수 있다.