2026年5月21日星期四

12 条新闻 — 🔴 3 重要 , 🟡 8 值得关注 , 🟢 1 有趣

← 前一天后一天 →

🤖 模型 (2)

🔴 🤖 模型 2026年5月21日 · 2 分钟阅读

OpenAI：AI模型推翻了离散几何学中存在80年的猜想

Editorial illustration: OpenAI AI模型推翻了离散几何学中存在80年的单位距离猜想

OpenAI宣布其AI模型解决了单位距离问题——这是离散几何学的核心猜想，自Paul Erdős于1946年提出以来悬而未决逾80年。公司将此结果描述为AI驱动数学研究的里程碑：模型不仅验证了既有命题，更通过构造反例将其推翻。

🟢 🤖 模型 2026年5月21日 · 1 分钟阅读

arXiv:2605.19762: ICML 2026论文声称代码并不能提升LLM的数学推理能力

$Editorial illustration: ICML 2026论文证明结构化推理信号超越纯代码，对LLM数学推理更有效$

被ICML 2026收录的arXiv预印本通过受控预训练实验表明，可执行代码本身并不能改善LLM模型的整体推理能力——代码大幅提升了编程能力，但在标准模式下与数学任务存在竞争关系。数学方面的真正进步来自跨领域结构化推理轨迹（代码-文本与数学-文本混合），对专家混合模型的机制分析在专家激活模式中揭示了这些交互关系。

📦 开源 (1)

🟡 📦 开源 2026年5月21日 · 2 分钟阅读

Stability AI：Stable Audio 3.0发布开放权重模型，支持最长6分钟生成

Editorial illustration: Stability AI Stable Audio 3开放权重模型系列，支持6分钟生成和修复功能

Stability AI于2026年5月20日发布Stable Audio 3.0——包含4个音频模型（Small SFX、Small、Medium、Large）的系列，其中3个为开放权重并已在Hugging Face上线。最大亮点是支持最长6分钟的音频生成（前版本仅支持47秒），以及音频修复、因果延续和LoRA微调功能。公司声明所有模型均使用经许可的数据进行训练。

⚖️ 监管 (1)

🔴 ⚖️ 监管 2026年5月21日 · 2 分钟阅读

EU AI办公室：高风险AI系统分类指南草案公开征询意见

Editorial illustration: EU AI办公室就《欧盟人工智能法》高风险AI系统分类启动咨询

欧盟委员会于2026年5月13日就《欧盟人工智能法》高风险AI系统分类指南草案启动专项公众咨询。咨询截止时间为5月22日中欧时间18时，指南将直接决定医疗、教育、关键基础设施及人力资源领域的哪些组织须满足最严格的监管要求。

🤝 智能体 (4)

🟡 🤝 智能体 2026年5月21日 · 2 分钟阅读

Anthropic：Claude Managed Agents推出MCP Tunnels与自托管沙盒

Editorial illustration: Anthropic MCP Tunnels支持私有网络，Claude Managed Agents自托管沙盒上线

Anthropic于2026年5月19日在Research Preview中发布了MCP Tunnels——允许Claude代理连接至用户私有网络中的Model Context Protocol服务器——以及作为Anthropic基础设施替代方案的自托管沙盒。更新还包括在活跃会话中动态更改MCP配置，以及超过10万Token的工具输出自动溢出到沙盒文件。

🟡 🤝 智能体 2026年5月21日 · 2 分钟阅读

Google DeepMind：Co-Scientist——面向科学研究的多代理AI合作伙伴

Editorial illustration: Google DeepMind Co-Scientist多代理AI系统加速科学研究

Google DeepMind于2026年5月19日发布Co-Scientist——这是一个基于Gemini的多代理AI系统，通过6个专门代理在"创意锦标赛"辩论中生成、讨论并改进科学假设。该系统与100余家研究机构合作开发，已在肝纤维化、ALS、细胞衰老和传染病研究中取得具体成果，将分析时间从数月压缩至数天。

🟡 🤝 智能体 2026年5月21日 · 1 分钟阅读

Google：I/O 2026第二波——Antigravity 2.0、Gemini Spark与Universal Cart

Editorial illustration: Google I/O 2026第二波发布——Antigravity 2.0、Gemini Spark与Universal Cart巩固代理优先战略

Google在I/O 2026大会上发布了第二波重磅AI产品：Antigravity 2.0——以代理为核心的开发平台，配备CLI和SDK；Gemini Spark——持续在设备端后台运行的个人AI代理；Universal Cart——跨Google服务整合的AI购物助手。三款产品紧随Gemini 3.5 Flash和Gemini Omni发布（已在前次报道中覆盖），共同奠定了Google代理优先生态系统战略。

🟡 🤝 智能体 2026年5月21日 · 2 分钟阅读

LangChain：Deep Agents引入QuickJS解释器，可在工具调用之间执行代码

Editorial illustration: LangChain Deep Agents的QuickJS解释器在工具调用之间保持状态，减少Token消耗

LangChain于2026年5月20日在Deep Agents框架中引入解释器——内置QuickJS运行时环境，允许代理在LLM工具调用之间编写和执行代码，无需将状态序列化到消息历史。公司称在某些任务上可节省高达35%的Token消耗，因为状态持久保存在运行时内而非模型上下文中，且默认不允许访问文件系统、网络或Shell，具有明确的可控动作空间。

🔧 硬件 (1)

🟡 🔧 硬件 2026年5月21日 · 1 分钟阅读

AMD：ROCm 7.13带来MI350P GPU、多VF虚拟化与TheRock模块化打包

Editorial illustration: AMD ROCm 7.13搭载MI350P GPU、多VF虚拟化与TheRock模块化打包

AMD于2026年5月20日发布ROCm 7.13——其开源AI计算栈的新版本，引入MI350P GPU支持、每个MI300X加速器最多8个隔离vGPU虚拟化、用于透明性能分析的开源ROCprof Trace解码器，以及带有领域专用SDK的模块化TheRock打包方案。该版本已在Ubuntu 26.04和RHEL 9.6上完成验证，并包含MI350X和MI355X的VMware ESXi 9.1支持。

🏥 实践应用 (2)

🟡 🏥 实践应用 2026年5月21日 · 2 分钟阅读

AWS：SageMaker AI新增OpenAI兼容API端点

Editorial illustration: AWS SageMaker AI提供OpenAI兼容API端点，可在自有GPU基础设施上直接替换

AWS于2026年5月20日宣布，Amazon SageMaker AI的实时推理端点现已提供OpenAI兼容API——可直接替换OpenAI SDK、LangChain和Strands Agents，只需更改URL即可。端点通过/openai/v1路径提供Chat Completions和流式传输支持，身份验证使用从AWS凭据生成的时效性Bearer令牌。

🟡 🏥 实践应用 2026年5月21日 · 2 分钟阅读

Google DeepMind：WeatherNext提前5天预测梅利莎飓风达到5级

Editorial illustration: Google DeepMind WeatherNext首次提前5天预测梅利莎飓风达到5级

Google DeepMind于2026年5月19日公布，其WeatherNext模型以80%的置信度提前整整5天准确预测了梅利莎飓风将达到5级——这是现代气象学中的首例。该模型使用50个并行情景的集合预报，上一季度被美国国家飓风中心评为飓风预报最高排名系统。

🛡️ 安全 (1)

🔴 🛡️ 安全 2026年5月21日 · 2 分钟阅读

GitHub：恶意VS Code扩展入侵约3800个内部代码仓库

Editorial illustration: GitHub内部仓库通过一名员工设备上的恶意VS Code扩展遭到入侵

GitHub于2026年5月18日披露，攻击者通过感染一名员工设备的第三方恶意VS Code扩展，访问了约3800个GitHub内部代码仓库。调查仍在进行中，公司表示尚无证据显示内部仓库以外的用户数据遭到泄露。这是IDE扩展成为企业开发者基础设施攻击向量的第二起重大事件。

← 前一天后一天 →