Anthropic:Project Glasswing首月发现超过10,000个高风险漏洞
Anthropic Project Glasswing聚集了约50个安全合作伙伴,使用Claude Mythos Preview扫描关键软件。首月发现超过10,000个高风险和严重漏洞,开放的开源扫描器在千个项目中发现6,202个漏洞,真阳性率达90.6%。
Anthropic Project Glasswing聚集了约50个安全合作伙伴,使用Claude Mythos Preview扫描关键软件。首月发现超过10,000个高风险和严重漏洞,开放的开源扫描器在千个项目中发现6,202个漏洞,真阳性率达90.6%。
研究人员证明,复杂的智能体工作流可以直接编码到微调后的小型模型权重中,而非外部编排框架(如LangChain或LangGraph)。该方法在旅行预订、Zoom支持和保险等三个真实场景(14至55个节点的工作流)中实现了接近前沿的质量,推理成本降低100倍。
研究人员提出了MOSS,一个通过重写自身源代码来改进的自主智能体框架——而不仅仅是提示词或微调权重。在OpenClaw基准测试中,一轮MOSS自我进化将分数从0.25提升至0.61,无需任何人工干预,证明智能体可以修复仅靠纯文本方法无法触及的路由、钩子和调度逻辑。
CUSP基准测试用4,700个事件的数据库测试AI模型预测科学突破的能力。前沿模型(GPT-5、Claude Opus 4.7、Gemini 3 Pro)能识别合理的研究方向,但系统性地以过高置信度猜测结果和时机。额外的截止前上下文并无帮助——限制是结构性的,而非信息性的。
来自DeepMind和MIT CSAIL的20名研究人员组成的团队发布了首个关于LLM在Lean定理证明器中自主生成形式证明的大规模评估。该智能体将LLM生成与Lean符号验证相结合,自主解决了353个开放Erdős问题中的9个,并证明了492个OEIS猜想中的44个。
LCGuard是一个新框架,用于保护多智能体系统中为提高效率而共享KV缓存时的数据泄露问题。由IBM Research和MIT的研究人员在Sadie Asif领衔下提出的研究,为「隐性通信守卫」方法建立了首个正式模型,适用于多个智能体通过共享内存共享上下文的生产级智能体RAG系统。
TerminalWorld是一项新基准测试,在真实Linux进程中对LLM智能体进行bash、git和文件操作的评估,无需任何模拟环境。由Zhaoyang Chu和Jiarui Hu领衔的八位作者为「计算机使用」智能体设立了新标杆,与Claude Code、GitHub Copilot Workspace和Cursor智能体模式等工具直接相关。
Anthropic发布了Claude Code CLI v2.1.149,将/usage命令扩展为按类别显示成本明细(skills、subagents、plugins、每个MCP服务器)。该版本修复了两个安全漏洞:PowerShell内置函数导致的权限绕过和git worktree沙箱的错误allowlist。还新增了企业设置allowAllClaudeAiMcps,方便连接云端MCP连接器。
Gartner在其2026年企业AI编码代理魔力象限报告中将GitHub定位为领导者——这是该类别存在以来连续第三年。GitHub Copilot目前被全球140,000个组织使用,评估强调了覆盖整个SDLC(从代码到审查、安全和治理)的智能体工作流,而不仅仅是代码生成。
GitHub发布了npm CLI版本11.15.0,引入分阶段发布——软件包在可供安装前需要维护者批准。还引入了三个新的安装时标志(--allow-file、--allow-remote、--allow-directory)以及现有的--allow-git,用于在npm install命令中精细控制依赖项来源。
AMD ROCm团队发布了在MI355 GPU上使用Gluon编程模型编写高性能GEMM内核的教程。经过优化的FP16内核达到1.489 TFLOPS,MFMA效率98.75%,扩展到BF8(3.257 TFLOPS)和MXFP4(5.255 TFLOPS)展示了对现代AI工作负载的适用性。教程包含将L2缓存未命中从530万减少到410万的工作组重映射与swizzle技术。
研究人员提出了Meta-Soft,一种用于LLM推理中动态KV缓存压缩的新方法。该方法使用可学习的正交基矩阵和选择器网络,合成软元令牌——长提示中关键信息的压缩表示。注意力流机制将已删除令牌的语义信息重新分配给保留的令牌,在大多数长上下文基准测试中优于现有的KV缓存驱逐方法。
WorkstreamBench是一项由Thomson Yen带领10位作者完成的新基准测试,在金融领域对LLM智能体进行真实Excel和电子表格任务的测试——包括发票、报告、费用分析。GPT-4o、Claude和Gemini在对比测试中均未能可靠地完成全部任务,这表明当前面向企业财务的智能体基础设施存在结构性不足。
Anthropic于UTC时间周六04:03发布了Claude Code CLI版本v2.1.150,距v2.1.149仅一天。该版本仅包含内部基础设施改进,无任何面向用户的更改。适用于Darwin、Linux和Windows的ARM64和x64架构,以及Linux musl构建版本。
Linux Foundation AI项目Kedro发布了1.2.0版本以及Kedro-Viz 12.3.0。新的@experimental装饰器允许标记处于开发中的API,starter项目support-agent-langgraph演示了与LangGraph编排和Langfuse/Opik提示管理工具的集成。Kedro-Viz获得了Mermaid图表和节点预览可扩展性,以改善管道调试。
UK AI Safety Institute(AISI)于2026年5月21日发布报告,基于对行业、政府和学界25位专家的访谈,分析了先进AI系统监管的未来。核心结论是:现有监管建立在可能逐步瓦解的基础之上。报告识别出20余条监管机制退化路径,重点关注潜在推理、能力遮蔽、外部AI行动及AI间通信四大领域。
Microsoft Research于2026年5月21日发布了针对小型模型智能体AI的三件套:MagenticLite(浏览器和文件系统UI应用程序)、MagenticBrain(从Qwen 3 14B微调的14B编排模型)和Fara1.5(4B、9B、27B三种规格的计算机使用模型)。Fara1.5-27B在Online-Mind2Web基准测试(300项网络任务)中达到SOTA 90%以上,几乎是前代Fara-7B性能的两倍。目标是证明智能体AI不需要巨型模型 — 只需设计良好的协同工具和执行框架。
研究人员于2026年5月21日在arXiv预印本服务器上发布了PALS — 一个将GPU功耗控制直接集成到MoE模型LLM服务中的运行时系统。PALS利用轻量级离线功耗性能模型和反馈控制器,根据吞吐量目标动态优化配置。在功耗限制下实现了26.3%的能效提升和4-7倍QoS违规减少,无需修改API或重新训练模型即可集成到vLLM。该方案直接解决了数据中心日益突出的运营瓶颈 — GPU集群能耗已成为规模增长的主要限制。
研究人员于2026年5月21日在arXiv发表了题为《扮演魔鬼代言人》的论文,表明为角色扮演任务开发的现有角色向量可以将谄媚行为(模型倾向于附和用户即便用户有误)减少到专门对比激活添加(CAA)方法效率的68-98%,且无需在谄媚专属数据上训练。几何分析揭示谄媚是角色层面的属性,而非激活空间中单一可引导的方向,这为对齐研究开辟了更便捷的路径。
AWS于2026年5月21日宣布Amazon Nova Act——用于浏览器和UI工作流自动化的智能体AI服务——已获得正式HIPAA合规资格。医疗机构现在可以使用Nova Act处理受保护的健康信息(ePHI),包括通过供应商网络门户自动完成预授权、保险核查和转诊发送。该服务与Amazon Bedrock AgentCore及Strand Agents框架集成,需要签署BAA协议和AWS KMS加密,目前仅在美东(北弗吉尼亚)地区提供。
Anthropic于2026年5月21日20:39 UTC发布Claude Code v2.1.147,引入了Workflow工具 — Claude Code生态系统中首个确定性多智能体编排机制。该工具初始默认禁用,通过环境变量CLAUDE_CODE_WORKFLOWS=1激活。同一版本将现有/simplify命令重命名为/code-review(支持高/中/低三个努力级别),并新增针对原型污染和基于thenable的逃逸攻击的沙箱加固。
欧盟委员会于2026年5月13日就《欧盟人工智能法》高风险AI系统分类指南草案启动专项公众咨询。咨询截止时间为5月22日中欧时间18时,指南将直接决定医疗、教育、关键基础设施及人力资源领域的哪些组织须满足最严格的监管要求。
GitHub于2026年5月18日披露,攻击者通过感染一名员工设备的第三方恶意VS Code扩展,访问了约3800个GitHub内部代码仓库。调查仍在进行中,公司表示尚无证据显示内部仓库以外的用户数据遭到泄露。这是IDE扩展成为企业开发者基础设施攻击向量的第二起重大事件。
OpenAI宣布其AI模型解决了单位距离问题——这是离散几何学的核心猜想,自Paul Erdős于1946年提出以来悬而未决逾80年。公司将此结果描述为AI驱动数学研究的里程碑:模型不仅验证了既有命题,更通过构造反例将其推翻。
AMD于2026年5月20日发布ROCm 7.13——其开源AI计算栈的新版本,引入MI350P GPU支持、每个MI300X加速器最多8个隔离vGPU虚拟化、用于透明性能分析的开源ROCprof Trace解码器,以及带有领域专用SDK的模块化TheRock打包方案。该版本已在Ubuntu 26.04和RHEL 9.6上完成验证,并包含MI350X和MI355X的VMware ESXi 9.1支持。
Google在Google I/O 2026发布Gemini 3.5 Flash和Pro——速度比竞争对手快4倍的前沿模型,重点强调智能体任务、面向开发者的全新Antigravity 2.0平台,以及全天候运行的个人AI智能体Gemini Spark。
Google在I/O 2026发布Gemini Omni Flash——新款多模态模型,可从图像、音频、视频和文本的组合中生成和编辑视频。即日起在YouTube Shorts可用,每个生成片段均附带SynthID数字水印。
Claude Code v2.1.145新增JSON格式实时会话列表输出功能,扩展了OTEL追踪属性以跟踪智能体,并修复了Bash命令授权时的安全漏洞。可通过npm install -g @anthropic-ai/claude-code获取更新。
Anthropic与KPMG签署战略全球联盟,Claude将覆盖全球四大会计师事务所之一的全体员工。Claude将集成至KPMG数字网关平台,KPMG同时成为Anthropic在私募股权领域的首选合作伙伴。
Anthropic于2026年5月18日收购了Stainless——这家成立于2022年的公司负责构建所有官方Anthropic SDK及MCP服务器工具。Stainless为数百家企业提供SDK生成服务,此次收购旨在改善Claude智能体与外部数据和工具的集成能力。
Anthropic在Claude API平台推出了三项重要更新:MCP Tunnels支持无需暴露互联网即可连接私有网络;自托管沙盒作为Anthropic托管基础设施的替代方案;以及超过100K token的工具输出自动文件溢出功能。
arXiv论文2605.15514从数学上证明:旋转位置编码(RoPE)——几乎所有现代大型语言模型(包括Llama、Mistral、Qwen和GPT-NeoX)使用的位置机制——在长上下文中会失去区分位置和词元的能力。作者得出结论:需要从根本上创新架构机制。
来自NUS和NTU的研究人员在arXiv论文2605.18661中分析了仅需15美元即可自主生成研究论文的系统。核心发现:前沿LLM会捏造结果,且无法可靠评估想法的新颖性。全面路线图划定了可靠辅助与不安全AI自主之间的边界。
Argus是由Zhen Zhang、Liangcai Su、Zhuo Chen等研究者于2026年5月15日发布的arXiv论文,提出了面向深度研究智能体的证据汇编框架。该系统采用双智能体架构——搜索器(ReAct风格轨迹)+导航器(共享证据图+强化学习合成)——单搜索器提升5.5个百分点,8路并行提升12.7个百分点,64路并行在BrowseComp上达到86.2分,且不超出上下文窗口限制。
CAST 是2026年5月14日发布于 arXiv 的论文,作者为 Renning Pang、Tian Lan、Leyuan Liu、Piao Tong、Sheng Cao 和 Xiaosong Zhang,提出了用于 LLM 工具使用的基于案例的校准框架。该方法将历史执行轨迹视为强化学习的结构化信息——在 BFCLv2 基线上实现了最高5.85个百分点的执行准确率提升,并将平均推理长度减少了26%。
「Hidden in Memory」是由Sidharth Pulipaka、Stanislau Hlebik、Leonidas Raghav、Sahar Abdelnabi、Vyas Raina、Ivaxi Sheth和Mario Fritz于2026年5月14日发布的arXiv论文,提出了针对有状态LLM智能体的延迟执行攻击。外部上下文(文档、网页)中的对抗性内容破坏智能体的持久化记忆——对GPT-5.5的成功率高达99.8%,对Kimi-K2.6达95%,被投毒记忆触发攻击者预期行为的概率为60%至89%。
GitHub于2026年5月17日宣布,GPT-5.3-Codex取代GPT-4.1,成为Copilot Business和Enterprise的基础模型。此次变更仅适用于企业级套餐(不含Copilot Pro、Pro+或Free)。GPT-5.3-Codex是首个LTS(长期支持)模型——保障从2026年2月5日至2027年2月4日共12个月的可用性。定价方面:1×高级请求乘数;GPT-4.1在2026年6月1日弃用前继续以0×乘数强制启用。
Claude Code v2.1.143是Anthropic于2026年5月15日发布的CLI代理新版本,本周第五个补丁。引入插件依赖强制执行与disable-chain提示、市场中的预测上下文成本显示(每轮及每次调用的token估算)、新的worktree.bgIsolation设置、PowerShell -ExecutionPolicy Bypass自动标志,以及在空闲唤醒后保留模型/努力级别的后台会话。
「从谄媚共识到Pluralistic Repair」是Varad Vishwarupe、Nigel Shadbolt和Marina Jirotka于2026年5月15日在arXiv发表的新对齐论文。作者认为当前多元对齐根本上聚焦于偏好聚合而非呈现分歧这一错误方向。论文提出了在Claude Sonnet 4.5(N=198)和GPT-4o(N=100)上测试的Pluralistic Repair Score(PRS)指标——两个模型均表现出低修复质量的附和行为。
FLUX Outpainting是Black Forest Labs于2026年5月14日发布的新图像生成功能,通过专用扩展端点向任意方向扩展图像。用户指定目标画布尺寸和位置坐标——模型在扩展区域保留光线、纹理、深度和构图,无需文本提示。最高4MP输出,可通过BFL API访问,公开演示地址为flux-tools.bfl.ai/outpainting。
GitHub Accessibility Agent是2026年5月15日发布的通用无障碍自动化案例研究。该智能体审查了3,535个拉取请求,解决率达68%,并发现了一个重要偏向:LLM由于在数十年不可访问的代码上训练,具有产生无障碍反模式的不良倾向。GitHub使用顺序审查者+实现者架构(双层模型)而非并行子智能体——降低了token消耗并提升了准确性。