arXiv:2604.21816:「Tool Attention Is All You Need」消除MCP Tax——智能体工作流每轮减少95%的token消耗
研究人员Anuj Sadani和Deepak Kumar于2026年4月23日在ArXiv上发表论文,解决了所谓的MCP Tax问题——贪婪模式的schema注入每轮消耗1至6万个token。他们的Tool Attention方法将消耗减少95%,上下文利用率从24%提升至91%。
8 条新闻 — 🟡 4 值得关注 , 🟢 4 有趣
研究人员Anuj Sadani和Deepak Kumar于2026年4月23日在ArXiv上发表论文,解决了所谓的MCP Tax问题——贪婪模式的schema注入每轮消耗1至6万个token。他们的Tool Attention方法将消耗减少95%,上下文利用率从24%提升至91%。
AWS与Visier展示了通过Amazon Q和模型上下文协议集成的人力资源AI智能体。Visier将HR分析作为MCP服务器公开,Amazon Q智能体利用这些工具进行人员编制预算、任职期限跟踪和阈值警报——全部通过一个对话界面完成。
GitHub于2026年4月24日宣布GitHub Copilot在JetBrains IDE中的内联Agent模式公开预览,包括改进的Next Edit Suggestions(支持远端编辑)、全局自动批准、更灵活的终端命令控制,以及Business和Enterprise计划的管理员激活功能。
Anthropic于2026年4月24日发布了Rate Limits API,这是Admin API的组成部分,允许管理员通过编程方式读取为组织和各工作区配置的速率限制。端点按模型组、批处理、文件、技能和网页搜索工具返回限制信息,需使用专用的Admin API密钥。
Anthropic发布了针对2026年美国中期选举的选举安全措施更新评估。Claude Opus 4.7获得95%,Sonnet 4.6获得96%的政治中立性测试得分,测试基于600个提示词,合规率达99.8-100%。
Natan Levy与Gadi Perl于2026年4月23日在ArXiv发表论文,填补了EU AI法案、NIST框架和欧洲委员会公约的监管空白。他们提出了一个包含RoMA与gRoMA工具的两阶段统计框架,可在无需访问模型内部结构的前提下计算可审计的故障率上界。
ArXiv上发表的新实证研究显示,与具有说服力的聊天机器人进行短暂对话会在53名受试者中产生统计显著的道德判断转变,且效应在两周内持续增强。对照组未显示任何变化,参与者对影响毫无察觉。