🟡 🤝 智能体 2026年5月4日星期一 · 2 分钟阅读 ·

ICML 2026 立场论文:30位作者认为智能体AI系统的编排必须符合贝叶斯一致性

Editorial illustration: ICML 2026 立场论文:30位作者认为智能体AI系统的编排必须符合贝叶斯一致性

来自学术和工业实验室的三十位研究人员发表了被ICML 2026接受的立场论文,认为智能体AI系统的控制层必须遵守贝叶斯一致性。作者认为LLM不适合在不确定性下做决策,但其上方的编排器可以且必须维护校准的信念并使用效用感知策略。

🤖

本文由人工智能基于一手来源生成。

来自学术和工业实验室的三十位研究人员(Theodore Papamarkou、Pierre Alquier、Andrew Gordon Wilson等)于2026年5月1日在arXiv上发表了立场论文”Position: Agentic AI orchestration should be Bayes-consistent”。该论文已被ICML 2026接受——这是机器学习三大顶级会议之一——对于没有实验结果的立场论文来说,这是罕见的分量。

核心论点很简单:LLM在预测和语言推理上表现出色,但在不确定性下的决策方面表现不佳。 与其尝试使LLM成为贝叶斯”引擎”——这在架构上代价过大——作者提议将贝叶斯原则放在LLM之上,放在协调它们的层中。

在智能体背景下贝叶斯一致性意味着什么?

贝叶斯一致性意味着系统维护关于相关变量(用户状态、任务结果、行动效用)的概率信念,并在交互中按贝叶斯定理更新它们。其结果是决策不仅仅是”最佳答案”,而是”预期效用”——系统考虑了它对自身假设的置信程度。

当前LangGraph、AutoGen和CrewAI等智能体系统通过硬图和启发式方法协调LLM。在不确定性下必须做出决策时(“用户需要额外的问题吗?”、“工具可靠吗?”),这些系统采用局部LLM评估,而这通常缺乏校准。

作者如何提议应用?

论文描述了概率编排的设计模式:量化工具选择时的不确定性,通过对话更新对用户的信念,以及根据预期效用而非最大响应概率选择行动。实现不需要修改LLM本身——这是关于LLM之上的层。

实际后果是可衡量的:知道自己不知道多少的系统可以决定提问而不是错误假设,或者当置信度低于阈值时升级给人类。

为什么30位作者是信号?

立场论文很少由数十位共同作者发表——通常这些是个人或小团体的宣言。来自不同机构(英国、法国、澳大利亚、加拿大、意大利)的三十位作者表明,这一立场背后存在研究社区的共识,而非孤立观点。

对于构建智能体系统的AI工程师,这篇论文作为在控制中引入概率层的正式论证——实践者直觉上称之为”不确定性感知路由”,但此前缺乏学术理论基础。

常见问题

贝叶斯一致性编排意味着什么?
这意味着智能体系统的控制层(协调LLM和工具的组件)维护关于相关变量的概率信念,并根据观察结果按贝叶斯定理更新它们。目标是在不确定性下做决策,这是LLM不擅长而概率模型擅长的。
为什么LLM不足以在不确定性下做决策?
LLM被训练用于预测下一个token和语言推理,而非在有限数据下进行概率推断。它们通常缺乏校准——模型对错误答案过于自信——这在未知情况下破坏决策质量。
什么是立场论文,ICML 2026接受意味着什么?
立场论文提出论证性观点而非实验结果,ICML很少接受此类论文。30位来自不同机构的作者发表的论文被接受,标志着研究社区对贝叶斯编排方法存在共识。