🟡 🤝 智能体 2026年5月9日星期六 · 1 分钟阅读 ·

arXiv:2605.06623: MASPO——多代理LLM系统的自动提示词优化框架,ICML 2026

arXiv:2605.06623 ↗

编辑插图:通过进化束搜索进行提示词优化的多代理LLM系统架构图

MASPO是一个利用进化束搜索对多代理LLM系统进行联合提示词优化的框架。在六个任务上平均提升2.9个百分点,已被ICML 2026收录。

🤖

本文由人工智能基于一手来源生成。

由王哲轩和刘学博领衔的研究团队于2026年5月7日在arXiv上发表了关于MASPO(多代理系统提示词优化)的论文,这是一个在多代理LLM系统中联合优化提示词的框架。论文已被ICML 2026收录,代码以CC BY 4.0许可发布在GitHub上。

MASPO解决了什么问题?

在多个LLM代理协作的系统中,每个代理都有自己的提示词——但由于局部代理目标与系统整体目标之间的不一致,联合优化所有提示词仍是一个难题。传统方法孤立评估提示词,忽略了代理间的交互,可能导致全局结果次优。

联合评估如何工作?

MASPO不按提示词的孤立结果来衡量,而是根据「促进下游代理成功的能力」来评估。当一个代理产生输出时,MASPO评估该输出对链中后续代理的帮助程度——将局部交互与全局系统指标连接起来,无需标注数据。优化使用进化束搜索,以数据驱动的方式高效导航高维提示词空间。

实际性能提升有多大?

在六个不同的评估任务上,MASPO相比当前最佳提示词优化方法平均提升2.9个百分点的准确率。作者强调结果在各任务上保持一致,表明该方法对特定应用域不敏感。

哪些资源已公开?

除arXiv预印本外,作者(王哲轩、刘学博、李旺、单子飞、王雨桐、宋振希、张敏)已将源代码发布在GitHub上,可供复现实验并应用于新的多代理配置。

常见问题

MASPO是什么?
MASPO(多代理系统提示词优化)是一个在整个多代理LLM系统中自动迭代优化提示词的框架,根据后续代理的成功情况评估每个提示词。
主要方法创新是什么?
MASPO不是孤立评估提示词,而是衡量单个提示词如何影响下游代理的成功,将局部目标与系统整体目标连接起来,无需标注数据。
性能提升有多大?
在六个评估任务上,MASPO相比现有最佳提示词优化方法平均提升2.9个百分点的准确率。