微调（Fine-tuning）

**微调（Fine-tuning）**是指在较小的精选数据集上对已预训练的大型语言模型进行继续训练，使其专注于特定任务、领域或风格的过程。模型在保留通用语言能力的同时，通过调整权重来适应新的目标。

常见的微调原因：

现代实践普遍采用参数高效微调（PEFT）——LoRA、QLoRA——只在冻结的基础权重之上训练一个小型适配器。这将 VRAM 需求降低 10 至 100 倍，使在单张 GPU 上进行微调成为可能。完整微调（更新所有权重）仅适用于最大规模的项目。

微调不同于：

对于 2026 年大多数产品使用场景，RAG 和提示工程无需微调即可达到可接受的质量。当任务范围狭窄且可重复，并拥有至少数百个高质量示例时，微调才真正物有所值。

来源