2026年5月13日星期三

15 条新闻 — 🟡 11 值得关注 , 🟢 4 有趣

← 前一天 后一天 →

🤖 模型 (2)

📦 开源 (2)

⚖️ 监管 (1)

🤝 智能体 (5)

🟡 🤝 智能体 2026年5月13日 · 1 分钟阅读

Anthropic: Claude Code v2.1.140 修复 /goal 挂起、热重载与 Read 偏移量验证

编辑插图:开发工具界面,包含代码行与终端提示符符号。

Claude Code v2.1.140 是 Anthropic CLI 智能体的新版本,于 2026 年 5 月 12 日发布,修复了十个缺陷,包括:当 disableAllHooks 设置启用时 /goal 命令静默挂起、热重载中符号链接 settings 文件的回归问题、企业端点安全启动问题,以及 Read 工具中 offset 参数的验证。子智能体类型匹配现在接受不区分大小写的值。

🟡 🤝 智能体 2026年5月13日 · 1 分钟阅读

arXiv:2605.12061 SAGE: 自进化图记忆引擎在 Natural Questions 上达到 91.6% Recall@5

编辑插图:带有节点与反馈箭头的动态图记忆结构示意图。

SAGE 是由王俊通等人于 2026 年 5 月 12 日在 arXiv 发表的面向 LLM 智能体的自进化图记忆引擎。该引擎采用记忆写入器与记忆读取器(图基础模型)构成的反馈循环,可自主扩展与重组。在 Natural Questions 的零样本开放域检索中,Recall@2/5 分别达到 82.5/91.6,并在 LongMemEval 与 HaluMem 幻觉指标上均有提升。

🟡 🤝 智能体 2026年5月13日 · 2 分钟阅读

Google DeepMind: AI Pointer 让 Gemini 在 Chrome 和 Googlebook 中响应鼠标指令

编辑插图:带有光晕光线的鼠标光标集成到浏览器界面中。

AI Pointer 是 Google DeepMind 于 2026 年 5 月 12 日发布的实验性产品,将 Gemini 模型集成到上下文感知的鼠标指针中。用户只需指向目标并说出简短指令,如「Fix this」或「Compare these」,无需将内容复制到单独的应用中。该功能已在 Chrome 中立即可用,Magic Pointer 将随新款 Googlebook 笔记本电脑推出。

🟡 🤝 智能体 2026年5月13日 · 2 分钟阅读

NVIDIA: OpenShell 与 SAP Joule Studio 为自主 AI 智能体引入企业级治理

编辑插图:带有策略执行符号的企业数据流防护层。

NVIDIA OpenShell 与 SAP Joule Studio 集成是一个新的企业智能体平台,于 2026 年 5 月 12 日 SAP Sapphire 大会上发布。NVIDIA OpenShell 提供隔离运行时与策略执行,SAP Business AI Platform 将其作为安全层集成,Joule Studio 则提供智能体构建环境。NemoClaw 参考蓝图已在 Joule Studio 中立即可用。

🟢 🤝 智能体 2026年5月13日 · 2 分钟阅读

arXiv:2605.11814 MedMemoryBench 揭示医疗智能体中的记忆饱和现象——2000 个会话,16000 轮对话

编辑插图:带有记忆记录与流式评估指示器的医疗智能体示意图。

MedMemoryBench 是首个针对个性化医疗 AI 智能体记忆机制的基准测试,由浙江大学团队于 2026 年 5 月 12 日在 arXiv 发布。通过人机协同流程构建了约 2000 个会话与 16000 个交互轮次。核心发现:主流 AI 架构在医疗推理场景下表现出记忆饱和现象,持续信息涌入会导致性能下降。

🏥 实践应用 (2)

🛡️ 安全 (3)

🟡 🛡️ 安全 2026年5月13日 · 2 分钟阅读

arXiv:2605.11882: FATE 框架通过在线自进化将智能体攻击成功率降低 33.5%

编辑插图:带有错误标记与安全检查点的智能体执行轨迹示意图。

FATE 框架是 Bo Yin、Qi Li 与 Xinchao Wang 于 2026 年 5 月 12 日发表在 arXiv 上的一种全新 LLM 智能体安全对齐方法。与传统 RLHF 仅评估单次响应不同,FATE 将验证器评分的失败轨迹转化为在线修复监督信号与帕累托前沿策略优化。结果显示攻击成功率降低 33.5%,有害合规率降低 82.6%。

🟢 🛡️ 安全 2026年5月13日 · 2 分钟阅读

arXiv:2605.10763: MATRA 框架通过资产+攻击树方法对智能体 AI 系统的攻击面进行建模

编辑插图:带有安全边界层的攻击树图。

MATRA 是一个实用的智能体 AI 系统威胁建模框架,于 2026 年 5 月 11 日在 arXiv 上发布。作者 Van Hamme、Vissers、Carnerero-Cano、Fritz、Lupu、Desmet 和 Divakaran 通过两步方法将经典风险评估方法论适配至 LLM 智能体——基于资产的影响评估加攻击树分析。在 OpenClaw 个人 AI 智能体上的演示已被 DeMeSSAI 2026(EuroS&P 2026)接受。

🟢 🛡️ 安全 2026年5月13日 · 2 分钟阅读

arXiv:2605.12474: 基于评分标准的强化学习存在奖励欺骗问题——更强验证器可减轻但无法消除

编辑插图:评分表单与策略箭头绕过真实指标的示意图。

《基于评分标准的强化学习中的奖励欺骗》是 Anas Mahmoud 等六位作者于 2026 年 5 月 12 日发表的论文。研究表明,在训练验证器上优化的策略会系统性地通过「部分满足复合标准」和「不精确主题匹配」来利用评分标准奖励。更强的验证器可减轻但无法消除这一漏洞。

← 前一天 后一天 →