インフラ

リランキング

検索の第二段階で、取得した候補を関連度で並べ替える手法。多くはクロスエンコーダを用い、RAG や検索の精度を高める。

リランキングreranking)は、取得した候補リストをクエリへの推定関連度で並べ替える検索の第二段階です。最初の取得——多くはベクトルデータベースやキーワードによる検索——は数十から数百件の候補文書を高速に返しますが、その順位は粗いものです。リランキングはこれらを精密に並べ替え、上位の数件だけを残します。

要点はモデルの違いにあります。初期取得はクエリと文書を別々に埋め込む_バイエンコーダ_を用いるため高速ですが精度は劣ります。リランカーは通常_クロスエンコーダ_で、クエリと文書を一緒にモデルへ通すことで両者のトークン間に直接アテンションが働き、はるかに較正された関連度スコアを得られます。代償として推論コストが重くなるため、絞り込んだ少数の候補だけを並べ替えます。

2025〜2026年にかけて、リランキングは本番の RAG パイプラインの標準構成要素です。わずかな追加レイテンシで取得精度を測定可能なほど高めるためで、商用モデル(Cohere Rerank、Jina、Voyage)やオープンウェイトのリランカー(BGE、FlashRank)により手軽に利用できます。

出典

関連項目