arXiv:2605.18732：LLM幻觉缩放定律

研究人员在38个模型和8900多条引用上证明，LLM的事实召回遵循sigmoid曲线：参数数量与主题在训练数据中出现频率的组合解释了60–94%的方差。幻觉并非随机——它们是可预测的和可测量的。

幻觉是可预测的——而且数学上可量化

来自arXiv的新论文（2605.18732）得出了一个令人不安但有用的结论：confabulations（作者比「hallucinations」更偏好的术语）并非随机错误。它们是可预测的现象，遵循缩放定律——就像语言流利度或上下文理解一样。

来自卢森堡大学的研究团队在超过8900条科学引用上测试了38个模型，发现事实召回（factual recall）质量遵循两个因素的对数线性组合的sigmoid曲线：模型参数数量和主题在训练数据中的出现频率。

为何是sigmoid——这在实践中意味着什么？

Sigmoid函数描述了在相对较窄的输入值范围内从「几乎从不正确」到「几乎总是正确」的过渡。类比：人不会因为更聪明就能线性地更好地记住刚读到的句子——存在一个阈值，低于该阈值什么都不会留下，高于该阈值一切都会留下。

对于LLM来说，这意味着：如果某个主题在训练数据中出现频率较低（例如，一篇晦涩的科学论文），即使是大型模型也会confabulate——虚构作者、年份、结论。另一方面，有充足参数支持的良好覆盖主题会进入sigmoid曲线的「安全区」。作者将此建模为信噪比：信号是数据中概念的频率，噪声是模型低于该频率后召回不起作用的容量「底部」。

Confabulation与hallucination是同一件事吗？

并不完全相同。Hallucination是一个更广泛的半正式术语——涵盖模型在输入或现实中没有基础的情况下生成内容的所有情况。Confabulation（借用自神经心理学）更精确地描述了自信地填补空白——模型不知道自己不知道，于是综合出一个令人信服但不正确的答案。这篇论文使用这个术语正是因为它强调了错误的可预测性和结构性，而非随机性。

实际后果：60–94%的事实准确性方差可以用两个可测量的因素来解释。这意味着可以预先估计特定主题的幻觉风险，而无需每次都在所有查询上测试模型。

常见问题

LLM中的confabulation是什么？

Confabulations是LLM在主题在训练数据中未充分代表时产生的虚构或不可靠回忆的事实（作者、年份、结论）。论文作者比起hallucinations更偏好这个术语。

为什么是sigmoid曲线，而不是线性误差下降？

Sigmoid描述阈值过渡：训练数据中主题出现频率低于某个阈值时，即使大型模型也几乎不能可靠地记住任何东西。高于阈值时，召回率迅速达到几乎总是正确。仅模型大小不够——信号噪声组合是决定性的。

这有什么实际意义？

如果知道模型大小和训练数据中主题代表性的估计，幻觉可以在推理之前预测。这为confidence routing打开了大门——系统将低资源主题的查询委托给使用外部源的工具，而不是仅仅依赖LLM召回。

arXiv:2605.18732：幻觉的缩放定律——更大的模型并不一定意味着更少的错误

幻觉是可预测的——而且数学上可量化

为何是sigmoid——这在实践中意味着什么？

Confabulation与hallucination是同一件事吗？

常见问题

来源

相关新闻