Anthropic: Claude Sonnet 4 和 Opus 4 将于6月15日停用
Anthropic宣布弃用原版Claude Sonnet 4和Claude Opus 4模型。两个模型将于2026年6月15日从API下线。开发团队需尽快迁移至4.6版本。
16 条新闻 — 🔴 2 重要 , 🟡 9 值得关注 , 🟢 5 有趣
Anthropic宣布弃用原版Claude Sonnet 4和Claude Opus 4模型。两个模型将于2026年6月15日从API下线。开发团队需尽快迁移至4.6版本。
对LLM内部机制的因果分析揭示,有害内容主要产生于模型的后层,主要通过MLP模块生成。最终层中的一小组神经元充当有害回复的控制机制。
Google发布了Gemini Robotics-ER 1.6,具备全新的仪表读取能力以及改进的空间和物理理解能力。前一版本1.5将于4月30日停用。
对GitHub上679个规则文件和25,532条规则的分析表明,禁止性规则能改善AI编程代理的表现,但正面指导实际上会产生负面影响。随机生成的规则与专家编写的规则效果相当。
新基准测试HORIZON系统性分析了LLM智能体在长期任务中的失败模式。研究发现错误会在多个步骤中累积,即使最优秀的模型在执行20步以上的动作后也会失去焦点。
首个评估多AI代理在隐私约束下协作的基准测试。结果表明隐私会显著降低协作质量,并导致三类错误,包括由隐私引起的幻觉。
SWE-AGILE引入了动态上下文策略,结合滑动窗口和压缩摘要用于AI编程代理。仅使用7-8B参数的模型就在SWE-Bench-Verified上达到了新的最优水平,仅用2,200个训练样本。
GitHub推出基于CodeQL引擎的免费Code Security Risk Assessment工具。可扫描每个组织最活跃的20个仓库,并按严重性、语言和规则展示漏洞。Copilot Autofix在2025年修复了460,258个安全警告。
GitHub现在允许开发者在启动Claude和Codex编程智能体时选择不同的AI模型。可用模型包括Claude Sonnet/Opus 4.5和4.6以及GPT-5.2/5.3/5.4-Codex。
HCompany在HuggingFace平台上发布了HoloTab,一款利用AI自动化网页任务的免费Chrome扩展。核心创新是Routines功能——录制一次操作,无限重复执行。
Hodoscope是一种新的无监督AI代理监控系统,通过比较分布来发现可疑行为,无需预定义错误类别。将所需审查量减少6-23倍,并在Commit0基准测试中发现了一个未知漏洞。
新系统Meerkat将聚类分析与代理搜索相结合,用于在大规模AI代理执行集合中发现罕见的安全违规。它在领先基准测试中发现了普遍的作弊行为,并发现了4倍于以往的奖励黑客攻击实例。
IBM推出两项新方案,帮助企业防御由AI智能体发起的攻击:针对前沿模型威胁的Enterprise Cybersecurity Assessment以及用于协调响应的IBM Autonomous Security。
新研究论文CIA(Communication Inference Attack)表明,仅通过外部查询即可重建LLM多智能体系统的通信拓扑,准确率达87%以上。这对AI系统的安全和隐私具有重大影响。