ICML 2026：30位作者论证贝叶斯式LLM智能体编排

来自学术和工业实验室的三十位研究人员发表了被ICML 2026接受的立场论文，认为智能体AI系统的控制层必须遵守贝叶斯一致性。作者认为LLM不适合在不确定性下做决策，但其上方的编排器可以且必须维护校准的信念并使用效用感知策略。

来自学术和工业实验室的三十位研究人员（Theodore Papamarkou、Pierre Alquier、Andrew Gordon Wilson等）于2026年5月1日在arXiv上发表了立场论文”Position: Agentic AI orchestration should be Bayes-consistent”。该论文已被ICML 2026接受——这是机器学习三大顶级会议之一——对于没有实验结果的立场论文来说，这是罕见的分量。

核心论点很简单：LLM在预测和语言推理上表现出色，但在不确定性下的决策方面表现不佳。 与其尝试使LLM成为贝叶斯”引擎”——这在架构上代价过大——作者提议将贝叶斯原则放在LLM之上，放在协调它们的层中。

在智能体背景下贝叶斯一致性意味着什么？

贝叶斯一致性意味着系统维护关于相关变量（用户状态、任务结果、行动效用）的概率信念，并在交互中按贝叶斯定理更新它们。其结果是决策不仅仅是”最佳答案”，而是”预期效用”——系统考虑了它对自身假设的置信程度。

当前LangGraph、AutoGen和CrewAI等智能体系统通过硬图和启发式方法协调LLM。在不确定性下必须做出决策时（“用户需要额外的问题吗？”、“工具可靠吗？”），这些系统采用局部LLM评估，而这通常缺乏校准。

作者如何提议应用？

论文描述了概率编排的设计模式：量化工具选择时的不确定性，通过对话更新对用户的信念，以及根据预期效用而非最大响应概率选择行动。实现不需要修改LLM本身——这是关于LLM之上的层。

实际后果是可衡量的：知道自己不知道多少的系统可以决定提问而不是错误假设，或者当置信度低于阈值时升级给人类。

为什么30位作者是信号？

立场论文很少由数十位共同作者发表——通常这些是个人或小团体的宣言。来自不同机构（英国、法国、澳大利亚、加拿大、意大利）的三十位作者表明，这一立场背后存在研究社区的共识，而非孤立观点。

对于构建智能体系统的AI工程师，这篇论文作为在控制中引入概率层的正式论证——实践者直觉上称之为”不确定性感知路由”，但此前缺乏学术理论基础。

常见问题

贝叶斯一致性编排意味着什么？

这意味着智能体系统的控制层（协调LLM和工具的组件）维护关于相关变量的概率信念，并根据观察结果按贝叶斯定理更新它们。目标是在不确定性下做决策，这是LLM不擅长而概率模型擅长的。

为什么LLM不足以在不确定性下做决策？

LLM被训练用于预测下一个token和语言推理，而非在有限数据下进行概率推断。它们通常缺乏校准——模型对错误答案过于自信——这在未知情况下破坏决策质量。

什么是立场论文，ICML 2026接受意味着什么？

立场论文提出论证性观点而非实验结果，ICML很少接受此类论文。30位来自不同机构的作者发表的论文被接受，标志着研究社区对贝叶斯编排方法存在共识。

ICML 2026 立场论文：30位作者认为智能体AI系统的编排必须符合贝叶斯一致性

在智能体背景下贝叶斯一致性意味着什么？

作者如何提议应用？

为什么30位作者是信号？

常见问题

来源

相关新闻