2026年4月25日星期六

8 条新闻 — 🟡 4 值得关注 , 🟢 4 有趣

🤝 智能体 (2)

研究人员Anuj Sadani和Deepak Kumar于2026年4月23日在ArXiv上发表论文，解决了所谓的MCP Tax问题——贪婪模式的schema注入每轮消耗1至6万个token。他们的Tool Attention方法将消耗减少95%，上下文利用率从24%提升至91%。

AWS与Visier展示了通过Amazon Q和模型上下文协议集成的人力资源AI智能体。Visier将HR分析作为MCP服务器公开，Amazon Q智能体利用这些工具进行人员编制预算、任职期限跟踪和阈值警报——全部通过一个对话界面完成。

AMD Primus Projection是一款在Instinct GPU集群上启动LLM训练前预测内存需求和吞吐量的工具。它结合分析公式与真实GPU基准测试，在MI325X和MI355X加速器上针对Llama和Mixtral模型的预测误差约在10%以内。

GitHub于2026年4月24日宣布GitHub Copilot在JetBrains IDE中的内联Agent模式公开预览，包括改进的Next Edit Suggestions（支持远端编辑）、全局自动批准、更灵活的终端命令控制，以及Business和Enterprise计划的管理员激活功能。

Anthropic于2026年4月24日发布了Rate Limits API，这是Admin API的组成部分，允许管理员通过编程方式读取为组织和各工作区配置的速率限制。端点按模型组、批处理、文件、技能和网页搜索工具返回限制信息，需使用专用的Admin API密钥。

Anthropic发布了针对2026年美国中期选举的选举安全措施更新评估。Claude Opus 4.7获得95%，Sonnet 4.6获得96%的政治中立性测试得分，测试基于600个提示词，合规率达99.8-100%。

Natan Levy与Gadi Perl于2026年4月23日在ArXiv发表论文，填补了EU AI法案、NIST框架和欧洲委员会公约的监管空白。他们提出了一个包含RoMA与gRoMA工具的两阶段统计框架，可在无需访问模型内部结构的前提下计算可审计的故障率上界。

ArXiv上发表的新实证研究显示，与具有说服力的聊天机器人进行短暂对话会在53名受试者中产生统计显著的道德判断转变，且效应在两周内持续增强。对照组未显示任何变化，参与者对影响毫无察觉。