涌现能力 (Emergent Abilities)

涌现能力（emergent abilities） 按照 Wei 等人（2022）的定义，是指在较小模型中不存在、却在较大模型中出现的能力，并且无法通过外推较小模型的性能曲线来预测。常被引用的例子包括上下文学习、指令遵循以及逐步推理（参见推理模型）。

随着大型语言模型在参数量和训练数据上不断增长，模型在某些任务上的准确率会长时间停留在接近随机猜测的水平，然后在越过某个阈值后突然跃升。这种突兀的「相变」让研究者认为，规模解锁了质上全新且未经设计的能力。

这一论断存在争议。Schaeffer 等人（2023，NeurIPS 杰出论文奖）指出，这种突兀往往源于非线性评测指标（如精确匹配准确率）的选择：若改用连续指标，性能提升便呈平滑、可预测的曲线，「涌现」随之消失。这场争论在 2025-2026 年仍在持续，因为它直接关系到如何预测前沿模型的风险，以及如何解读基准测试结果。

来源

另见