arXiv:2605.18732:幻觉的缩放定律——更大的模型并不一定意味着更少的错误
研究人员在38个模型和8900多条引用上证明,LLM的事实召回遵循sigmoid曲线:参数数量与主题在训练数据中出现频率的组合解释了60–94%的方差。幻觉并非随机——它们是可预测的和可测量的。
本文由人工智能基于一手来源生成。
幻觉是可预测的——而且数学上可量化
来自arXiv的新论文(2605.18732)得出了一个令人不安但有用的结论:confabulations(作者比「hallucinations」更偏好的术语)并非随机错误。它们是可预测的现象,遵循缩放定律——就像语言流利度或上下文理解一样。
来自卢森堡大学的研究团队在超过8900条科学引用上测试了38个模型,发现事实召回(factual recall)质量遵循两个因素的对数线性组合的sigmoid曲线:模型参数数量和主题在训练数据中的出现频率。
为何是sigmoid——这在实践中意味着什么?
Sigmoid函数描述了在相对较窄的输入值范围内从「几乎从不正确」到「几乎总是正确」的过渡。类比:人不会因为更聪明就能线性地更好地记住刚读到的句子——存在一个阈值,低于该阈值什么都不会留下,高于该阈值一切都会留下。
对于LLM来说,这意味着:如果某个主题在训练数据中出现频率较低(例如,一篇晦涩的科学论文),即使是大型模型也会confabulate——虚构作者、年份、结论。另一方面,有充足参数支持的良好覆盖主题会进入sigmoid曲线的「安全区」。作者将此建模为信噪比:信号是数据中概念的频率,噪声是模型低于该频率后召回不起作用的容量「底部」。
Confabulation与hallucination是同一件事吗?
并不完全相同。Hallucination是一个更广泛的半正式术语——涵盖模型在输入或现实中没有基础的情况下生成内容的所有情况。Confabulation(借用自神经心理学)更精确地描述了自信地填补空白——模型不知道自己不知道,于是综合出一个令人信服但不正确的答案。这篇论文使用这个术语正是因为它强调了错误的可预测性和结构性,而非随机性。
实际后果:60–94%的事实准确性方差可以用两个可测量的因素来解释。这意味着可以预先估计特定主题的幻觉风险,而无需每次都在所有查询上测试模型。
常见问题
- LLM中的confabulation是什么?
- Confabulations是LLM在主题在训练数据中未充分代表时产生的虚构或不可靠回忆的事实(作者、年份、结论)。论文作者比起hallucinations更偏好这个术语。
- 为什么是sigmoid曲线,而不是线性误差下降?
- Sigmoid描述阈值过渡:训练数据中主题出现频率低于某个阈值时,即使大型模型也几乎不能可靠地记住任何东西。高于阈值时,召回率迅速达到几乎总是正确。仅模型大小不够——信号噪声组合是决定性的。
- 这有什么实际意义?
- 如果知道模型大小和训练数据中主题代表性的估计,幻觉可以在推理之前预测。这为confidence routing打开了大门——系统将低资源主题的查询委托给使用外部源的工具,而不是仅仅依赖LLM召回。