arXiv:2605.06623: MASPO多代理LLM提示词联合优化

MASPO是一个利用进化束搜索对多代理LLM系统进行联合提示词优化的框架。在六个任务上平均提升2.9个百分点，已被ICML 2026收录。

由王哲轩和刘学博领衔的研究团队于2026年5月7日在arXiv上发表了关于MASPO（多代理系统提示词优化）的论文，这是一个在多代理LLM系统中联合优化提示词的框架。论文已被ICML 2026收录，代码以CC BY 4.0许可发布在GitHub上。

MASPO解决了什么问题？

在多个LLM代理协作的系统中，每个代理都有自己的提示词——但由于局部代理目标与系统整体目标之间的不一致，联合优化所有提示词仍是一个难题。传统方法孤立评估提示词，忽略了代理间的交互，可能导致全局结果次优。

MASPO不按提示词的孤立结果来衡量，而是根据「促进下游代理成功的能力」来评估。当一个代理产生输出时，MASPO评估该输出对链中后续代理的帮助程度——将局部交互与全局系统指标连接起来，无需标注数据。优化使用进化束搜索，以数据驱动的方式高效导航高维提示词空间。

在六个不同的评估任务上，MASPO相比当前最佳提示词优化方法平均提升2.9个百分点的准确率。作者强调结果在各任务上保持一致，表明该方法对特定应用域不敏感。

除arXiv预印本外，作者（王哲轩、刘学博、李旺、单子飞、王雨桐、宋振希、张敏）已将源代码发布在GitHub上，可供复现实验并应用于新的多代理配置。

常见问题

MASPO是什么？

MASPO（多代理系统提示词优化）是一个在整个多代理LLM系统中自动迭代优化提示词的框架，根据后续代理的成功情况评估每个提示词。

主要方法创新是什么？

MASPO不是孤立评估提示词，而是衡量单个提示词如何影响下游代理的成功，将局部目标与系统整体目标连接起来，无需标注数据。

性能提升有多大？

在六个评估任务上，MASPO相比现有最佳提示词优化方法平均提升2.9个百分点的准确率。