生产级LLM智能体的6种运行时模式——arXiv:2605.20173

新发布的arXiv论文引入「随机-确定性边界」作为生产级LLM智能体的核心设计原则，并定义了6种可组合的运行时模式——从分层委派到人机协作——根据三个架构关切进行选择：协调、状态与控制。

在实验室中构建一个能正常运行的LLM智能体相对容易。但要构建一个在生产环境中稳定运行的智能体——那则是另一回事。新发布的arXiv论文（Vasundra Srinivasan，2605.20173）为这一差距提供了首个系统性方法论。

什么是随机-确定性边界？

论文的核心洞见是**随机-确定性边界（SDB）**的概念——即不确定性LLM推理与确定性执行的系统操作之间的分界线。SDB是一个四方契约：提议者（LLM）提出操作，验证者检查是否满足预定义规则，提交步骤将决策记录为不可逆操作，拒绝信号携带诊断信息将控制权归还。

缺乏明确的SDB意味着系统无法界定随机性的终点与责任的起点——这是大多数生产事故的根本原因。

论文将可靠性拆解为两个维度：单次调用的模型方差和架构动力。一个反直觉的结论：随着模型精度的提高，架构模式的选择变得按比例更加关键。模型噪声的减少意味着协调与控制层面的系统性缺陷将主导整体错误率。

六种可组合模式按协调、状态和控制三个关切维度组织，可自由组合。参考实现展示了一个90天合同续签智能体，结合了scatter-gather加saga与人机协作门控。

值得特别关注的是回放偏差警告——同一确定性事件日志在模型更新或提示词修改后产生不同输出。在受监管行业（金融、法律、医疗）中，这可能使整个审计追踪追溯性失效。

论文提供了错误归因诊断程序和五步模式选择方法论。对于从原型转向生产环境的团队而言，这是必读之作。

常见问题

什么是随机-确定性边界？

这是提议者、验证者、提交步骤和拒绝信号之间的四方契约，用于决定LLM输出在何时以何种方式成为不可逆的系统操作。

论文中的6种运行时模式分别是什么？

分层委派、scatter-gather加saga、事件驱动序列、共享状态机、supervisor加gate，以及人机协作——每种模式针对不同的协调、状态和控制组合。

什么是回放偏差（replay divergence）？为何它很危险？

这是一种错误：当使用确定性事件日志的智能体在模型或提示词更新后产生不一致的输出——对生产系统中的审计追踪、合规性和可重现性构成严重威胁。