上下文提示超越LangGraph和CrewAI的实验证明

上下文提示是一种将整个过程性工作流直接嵌入系统提示的架构方法，而非通过框架进行编排。一项涵盖每个条件下200次对话的ArXiv研究表明，这种方法在三个领域中超越了LangGraph、CrewAI、Google ADK和OpenAI Agents SDK：旅行预订、Zoom技术支持和保险理赔处理。

Simon Dennis、Michael Diamond、Rivaan Patil、Kevin Shabahang和Hao Guo团队于2026年4月30日在ArXiv发表了一篇题目颇具挑战性的研究：“上下文提示使过程性任务中的智能体编排成为多余”。他们的核心论点是：当今前沿模型的先进能力使外部编排框架在大量过程性多轮任务中变得多余。

为什么上下文提示优于编排？

上下文方法将整个过程性工作流——步骤列表、分支条件、输出格式、升级流程——直接嵌入单个模型的系统提示中。编排框架（LangGraph、CrewAI、Google ADK、OpenAI Agents SDK）将相同的工作流分解成图形节点，并将模型调用委托给独立的协调逻辑。作者认为，前沿模型现在具备足够的”自我编排”能力，能够在单次调用中遵循复杂流程，而图形化的上下文切换引入了增加失败率的损耗。

三个领域和具体结果

实验在三个领域进行：旅行预订、Zoom技术支持和保险理赔处理——每个条件下进行200次对话，使用LLM-as-judge在五个质量标准上评分。上下文基线取得4.53–5.00分，而最接近的编排器LangGraph以4.17–4.84分落后。失败率差异更为明显：上下文方法各领域分别为11.5%、0.5%和5%，而编排方法为24%、9%和17%。

这对构建智能体意味着什么

研究结论并非说编排框架普遍多余——它们在需要并行流程、外部记忆或多个独立智能体的任务中仍有其作用。但对于具有明确步骤的结构化过程性任务，这项研究表明架构简单性——一个精心编写的系统提示——比图形节点更可靠。对2026年智能体技术栈的启示是：智能体设计的第一步应该是尝试通过上下文提示解决问题，然后才考虑使用框架。

常见问题

比较了哪些框架？

LangGraph、CrewAI、Google ADK和OpenAI Agents SDK与将工作流直接嵌入系统提示的上下文基线进行了比较。

结果范围如何？

上下文方法在1–5分制上取得4.53–5.00分，而编排框架停留在4.17–4.84区间。失败率差异更为显著：各领域分别为11.5%/0.5%/5% vs 24%/9%/17%。

ArXiv研究：上下文提示在过程性任务中超越LangGraph、CrewAI、Google ADK和OpenAI Agents SDK

为什么上下文提示优于编排？

三个领域和具体结果

这对构建智能体意味着什么

常见问题

来源

相关新闻