ファインチューニング

ファインチューニングとは、訓練済みの大規模言語モデルを、より小規模でキュレーションされたデータセットで追加訓練し、特定のタスク・ドメイン・スタイルに特化させるプロセスです。モデルは汎用的な言語能力を維持しながら、新しい目標に向けて重みを調整します。

ファインチューニングが活用される主な理由：

ドメイン専門知識 — 法律・医療・金融の専門的な言語への対応
ブランドボイス — 製品に一貫したトーンをもたせる
タスク特化 — ファンクションコールの信頼性、構造化された出力
パフォーマンス — 狭いタスクでは小さなファインチューニング済みモデルが大きな汎用モデルを上回ることがある

現代的な手法ではパラメータ効率的ファインチューニング（PEFT）、特にLoRAやQLoRAが用いられます。これは凍結されたベース重みの上に小さなアダプターのみを訓練するもので、VRAMの要件を10〜100分の1に削減し、シングルGPUでのファインチューニングを現実的なものにします。すべての重みを更新する完全ファインチューニングは最大規模のプロジェクトのみに使われます。

ファインチューニングと混同されやすい概念との違い：

事前訓練： Webコーパス全体を使った初期訓練
RLHF / DPO： 人間の嗜好からのアライメント（ファインチューニングの一段階であることが多い）
プロンプトエンジニアリング： モデルではなく入力のみを変更する
RAG： モデルを変更せず、推論時にコンテキストを取得する

2026年時点のほとんどの製品ユースケースでは、RAGとプロンプトエンジニアリングで十分な品質が得られます。ファインチューニングが価値を持つのは、狭い反復タスクがあり、数百件以上の高品質なサンプルが揃っている場合です。

出典

関連項目