基础

涌现能力 (Emergent Abilities)

小模型中不存在、却随规模扩大而突然出现的能力;这是一个有争议的论断——批评者认为这种突变源于非线性评测指标的选择。

涌现能力(emergent abilities 按照 Wei 等人(2022)的定义,是指在较小模型中不存在、却在较大模型中出现的能力,并且无法通过外推较小模型的性能曲线来预测。常被引用的例子包括上下文学习、指令遵循以及逐步推理(参见推理模型)。

随着大型语言模型在参数量和训练数据上不断增长,模型在某些任务上的准确率会长时间停留在接近随机猜测的水平,然后在越过某个阈值后突然跃升。这种突兀的「相变」让研究者认为,规模解锁了质上全新且未经设计的能力。

这一论断存在争议。Schaeffer 等人(2023,NeurIPS 杰出论文奖)指出,这种突兀往往源于非线性评测指标(如精确匹配准确率)的选择:若改用连续指标,性能提升便呈平滑、可预测的曲线,「涌现」随之消失。这场争论在 2025-2026 年仍在持续,因为它直接关系到如何预测前沿模型的风险,以及如何解读基准测试结果。

来源

另见