2026年4月15日星期三

16 条新闻 — 🔴 2 重要 , 🟡 9 值得关注 , 🟢 5 有趣

← 前一天后一天 →

🤖 模型 (3)

🔴 🤖 模型 2026年4月15日 · 1 分钟阅读

Anthropic: Claude Sonnet 4 和 Opus 4 将于6月15日停用

Anthropic宣布弃用原版Claude Sonnet 4和Claude Opus 4模型。两个模型将于2026年6月15日从API下线。开发团队需尽快迁移至4.6版本。

🟡 🤖 模型 2026年4月15日 · 1 分钟阅读

ArXiv：发现大语言模型生成有害回复的神经元机制

对LLM内部机制的因果分析揭示，有害内容主要产生于模型的后层，主要通过MLP模块生成。最终层中的一小组神经元充当有害回复的控制机制。

🟡 🤖 模型 2026年4月15日 · 1 分钟阅读

Google: Gemini Robotics-ER 1.6 带来仪表读取和空间理解能力

Google发布了Gemini Robotics-ER 1.6，具备全新的仪表读取能力以及改进的空间和物理理解能力。前一版本1.5将于4月30日停用。

⚖️ 监管 (1)

🟢 ⚖️ 监管 2026年4月15日 · 1 分钟阅读

OECD：英国为政府算法透明度树立全球标准

OECD分析了英国的算法透明度记录标准（ATRS），该标准自2025年起对中央政府具有强制性。截至2025年3月，已发布125条算法使用记录。爱沙尼亚已采纳该标准，OECD称其为'世界领先'。

🤝 智能体 (4)

🔴 🤝 智能体 2026年4月15日 · 1 分钟阅读

ArXiv：禁止规则有效，正面指导反而有害——关于AI编程代理规则的实证研究

对GitHub上679个规则文件和25,532条规则的分析表明，禁止性规则能改善AI编程代理的表现，但正面指导实际上会产生负面影响。随机生成的规则与专家编写的规则效果相当。

🟡 🤝 智能体 2026年4月15日 · 1 分钟阅读

ArXiv: HORIZON — AI智能体在长期任务中何处以及为何失败

新基准测试HORIZON系统性分析了LLM智能体在长期任务中的失败模式。研究发现错误会在多个步骤中累积，即使最优秀的模型在执行20步以上的动作后也会失去焦点。

🟡 🤝 智能体 2026年4月15日 · 1 分钟阅读

ArXiv：PAC-BENCH — 当AI代理必须在协作中保守秘密时会发生什么？

首个评估多AI代理在隐私约束下协作的基准测试。结果表明隐私会显著降低协作质量，并导致三类错误，包括由隐私引起的幻觉。

🟢 🤝 智能体 2026年4月15日 · 1 分钟阅读

ArXiv：SWE-AGILE — 小模型如何解决编程代理的上下文爆炸问题

SWE-AGILE引入了动态上下文策略，结合滑动窗口和压缩摘要用于AI编程代理。仅使用7-8B参数的模型就在SWE-Bench-Verified上达到了新的最优水平，仅用2,200个训练样本。

🏥 实践应用 (3)

🟡 🏥 实践应用 2026年4月15日 · 1 分钟阅读

GitHub：免费代码安全评估工具可在几分钟内发现漏洞

GitHub推出基于CodeQL引擎的免费Code Security Risk Assessment工具。可扫描每个组织最活跃的20个仓库，并按严重性、语言和规则展示漏洞。Copilot Autofix在2025年修复了460,258个安全警告。

🟡 🏥 实践应用 2026年4月15日 · 1 分钟阅读

GitHub: Claude和Codex智能体现已支持模型选择

GitHub现在允许开发者在启动Claude和Codex编程智能体时选择不同的AI模型。可用模型包括Claude Sonnet/Opus 4.5和4.6以及GPT-5.2/5.3/5.4-Codex。

🟢 🏥 实践应用 2026年4月15日 · 1 分钟阅读

HuggingFace: HoloTab — 自动化浏览器操作的免费AI助手

HCompany在HuggingFace平台上发布了HoloTab，一款利用AI自动化网页任务的免费Chrome扩展。核心创新是Routines功能——录制一次操作，无限重复执行。

💬 社区 (1)

🟢 💬 社区 2026年4月15日 · 1 分钟阅读

Google：1.2亿美元投入全球AI机遇，1亿人完成培训

Google与MIT在华盛顿共同举办首届AI for the Economy Forum。公布：全球1亿人完成数字技能培训、1.2亿美元AI教育新基金，以及针对医疗、学徒制和制造业的三个新项目。

🛡️ 安全 (4)

🟡 🛡️ 安全 2026年4月15日 · 1 分钟阅读

ArXiv：Hodoscope — 无需预定义错误类别即可监控AI代理

Hodoscope是一种新的无监督AI代理监控系统，通过比较分布来发现可疑行为，无需预定义错误类别。将所需审查量减少6-23倍，并在Commit0基准测试中发现了一个未知漏洞。

🟡 🛡️ 安全 2026年4月15日 · 1 分钟阅读

ArXiv：Meerkat在数千条AI代理执行轨迹中发现隐藏的安全违规

新系统Meerkat将聚类分析与代理搜索相结合，用于在大规模AI代理执行集合中发现罕见的安全违规。它在领先基准测试中发现了普遍的作弊行为，并发现了4倍于以往的奖励黑客攻击实例。

🟡 🛡️ 安全 2026年4月15日 · 1 分钟阅读

IBM: 应对AI智能体攻击的网络安全新举措

IBM推出两项新方案，帮助企业防御由AI智能体发起的攻击：针对前沿模型威胁的Enterprise Cybersecurity Assessment以及用于协调响应的IBM Autonomous Security。

🟢 🛡️ 安全 2026年4月15日 · 1 分钟阅读

ArXiv: CIA揭示多智能体系统隐私可被黑盒方式破解

新研究论文CIA（Communication Inference Attack）表明，仅通过外部查询即可重建LLM多智能体系统的通信拓扑，准确率达87%以上。这对AI系统的安全和隐私具有重大影响。

← 前一天后一天 →