文脈内学習 (In-Context Learning)

文脈内学習（In-Context Learning、ICL）とは、大規模言語モデルがプロンプト内に与えられた例示や指示だけを手がかりに新しいタスクを遂行する能力であり、重みの更新を一切伴わない。モデルのパラメータを恒久的に書き換えるファインチューニングとは異なり、ICL は一時的である。モデルは現在のセッションでのみ「学習」し、その知識を推論時に直接適用する。

与える例の数によって形態が分かれる。ゼロショットではモデルにタスクの説明のみを与えるのに対し、少数ショットでは入力と出力の組をいくつか提示し、そこから求められるパターンを推測させる。この用語は GPT-3（Brown ら、2020）によって広く知られるようになり、十分に大きなモデルが「テキストのみで、勾配更新を一切行わずに」新しいタスクを解けることを示した。

ICL はモデル規模の拡大とともに強まる創発的能力の一つと広く見なされている。2025〜2026 年にかけて、巨大なコンテキストウィンドウの普及によりその実用的価値が高まっており、数百の例を用いるメニーショット ICL は一部のタスクでファインチューニング済みモデルに迫る性能を示すほか、思考の連鎖などの手法の基盤にもなっている。

出典

関連項目