arXiv:2605.06623: MASPO——多代理LLM系统的自动提示词优化框架,ICML 2026
MASPO是一个利用进化束搜索对多代理LLM系统进行联合提示词优化的框架。在六个任务上平均提升2.9个百分点,已被ICML 2026收录。
本文由人工智能基于一手来源生成。
由王哲轩和刘学博领衔的研究团队于2026年5月7日在arXiv上发表了关于MASPO(多代理系统提示词优化)的论文,这是一个在多代理LLM系统中联合优化提示词的框架。论文已被ICML 2026收录,代码以CC BY 4.0许可发布在GitHub上。
MASPO解决了什么问题?
在多个LLM代理协作的系统中,每个代理都有自己的提示词——但由于局部代理目标与系统整体目标之间的不一致,联合优化所有提示词仍是一个难题。传统方法孤立评估提示词,忽略了代理间的交互,可能导致全局结果次优。
联合评估如何工作?
MASPO不按提示词的孤立结果来衡量,而是根据「促进下游代理成功的能力」来评估。当一个代理产生输出时,MASPO评估该输出对链中后续代理的帮助程度——将局部交互与全局系统指标连接起来,无需标注数据。优化使用进化束搜索,以数据驱动的方式高效导航高维提示词空间。
实际性能提升有多大?
在六个不同的评估任务上,MASPO相比当前最佳提示词优化方法平均提升2.9个百分点的准确率。作者强调结果在各任务上保持一致,表明该方法对特定应用域不敏感。
哪些资源已公开?
除arXiv预印本外,作者(王哲轩、刘学博、李旺、单子飞、王雨桐、宋振希、张敏)已将源代码发布在GitHub上,可供复现实验并应用于新的多代理配置。
常见问题
- MASPO是什么?
- MASPO(多代理系统提示词优化)是一个在整个多代理LLM系统中自动迭代优化提示词的框架,根据后续代理的成功情况评估每个提示词。
- 主要方法创新是什么?
- MASPO不是孤立评估提示词,而是衡量单个提示词如何影响下游代理的成功,将局部目标与系统整体目标连接起来,无需标注数据。
- 性能提升有多大?
- 在六个评估任务上,MASPO相比现有最佳提示词优化方法平均提升2.9个百分点的准确率。