全部 🤖 模型 🚀 创业公司 📦 开源 ⚖️ 监管 🤝 智能体 🔧 硬件 🏥 实践应用 💬 社区 🛡️ 安全 ✨ 趣闻

🟡 🛡️ 安全 2026年4月12日星期日 · 1 分钟阅读

ArXiv ACIArena:针对 AI 代理链提示注入攻击的首个基准测试

为什么重要

An 及其合作者团队发布了针对 6 种多代理实现的 1,356 个测试用例,测量对「级联注入」攻击的鲁棒性——其中恶意提示通过代理间通信通道传递。

一种新型提示注入攻击

多代理系统(LangGraph、AutoGen、CrewAI、OpenAI Swarm)在需要协调多个 AI 代理的任务中越来越受欢迎。但是每个与另一个代理通信的代理都代表了新的攻击面——根据 4 月 10 日发布的新论文,这个面被危险地研究不足。

由 An 领导的团队提出了 ACIArena — 首个针对**代理级联注入(ACI)**的系统性基准测试。这是一类攻击,其中:

攻击者将恶意提示注入系统的一个组件(例如,第一个代理读取的文档)
第一个代理处理输入并将”处理后”的结果传递给下一个代理
恶意内容被”呈现”为合法的系统内部通信
后续代理将受损的数据视为可信
链条继续,直到有人执行危险操作

基准测试包含什么

ACIArena 通过 6 种多代理实现涵盖了 1,356 个测试用例。测试用例涵盖:

各种输入向量(文档、网页、API 响应)
各种代理拓扑(顺序、并行、分层)
各种最终动作类型(读取文件、编写代码、发送电子邮件、执行 shell 命令)

为什么这很重要

当前大多数安全研究聚焦于单代理场景——用户直接与单一模型对话。但实际的生产部署越来越依赖于代理链,其中一个代理信任另一个代理的结果。ACIArena 正式衡量了这种”代理间信任”的薄弱程度。

对于已经使用 LangGraph 和 AutoGen 的开发团队来说,此基准测试应成为生产部署前安全评估的必备组成部分。到目前为止,缺少基准测试意味着攻击只有在事件发生后才被发现。

🤖 本文由人工智能基于一手来源生成。

来源

ArXiv:ACIArena — 代理级联注入基准测试 ↗

分享: 𝕏 X in LinkedIn f Facebook

相关新闻

🟡 2026-04-14

ArXiv：算法单一化——大语言模型在需要差异化时却不会分化

🟡 2026-04-14

ArXiv OpenKedge：要求AI智能体每次操作前获得许可的密码学协议

🟡 2026-04-14

GitHub：通过交互式安全游戏学习攻破 AI 智能体

← 返回首页