2026年5月8日星期五

10 条新闻 — 🔴 5 重要 , 🟡 5 值得关注

🤖 模型 (2)

🔴 🤖 模型 2026年5月8日 · 1 分钟阅读

OpenAI: API中推出三款全新实时语音模型，支持推理与翻译

OpenAI于2026年5月7日在API中发布了三款全新实时语音模型：GPT-Realtime-2具备GPT-5级推理能力和128,000词元的上下文窗口；GPT-Realtime-Translate支持将70余种输入语言翻译为13种输出语言；GPT-Realtime-Whisper提供实时语音转录功能。

🟡 🤖 模型 2026年5月8日 · 1 分钟阅读

Google: Gemini 3.1 Flash-Lite正式进入全面可用阶段

Gemini 3.1 Flash-Lite自2026年5月7日起通过Gemini API正式进入全面可用（GA）阶段，作为稳定的生产端点。该模型针对速度、规模和成本效率进行了优化，预览版将于2026年5月25日停止服务。

⚖️ 监管 (1)

🔴 ⚖️ 监管 2026年5月8日 · 2 分钟阅读

EU AI Office: 欧盟委员会就AI法案透明度指南草案启动公众咨询

Editorial illustration: 欧盟委员会就AI法案透明度指南草案启动公众咨询

欧盟委员会发布了AI法案透明度义务指南草案，并启动公众咨询，截止日期为2026年6月3日。义务将于2026年8月2日生效。提供商必须使用机器可读标记标注AI生成内容，并告知用户其与AI系统的交互情况。

🤝 智能体 (4)

🔴 🤝 智能体 2026年5月8日 · 1 分钟阅读

Google DeepMind: AlphaEvolve通过Google Cloud开放，首批产业成果公布

编辑插图：AlphaEvolve通过Google Cloud开放，首批产业成果公布

Google DeepMind于2026年5月发布了AlphaEvolve代理的首份产业影响报告，并通过Google Cloud开放了商业访问权限。Klarna将Transformer模型训练速度提升了一倍，FM Logistic实现了10.4%的路由效率提升，Schrödinger的分子模拟速度提升了4倍。

🔴 🤝 智能体 2026年5月8日 · 2 分钟阅读

AWS: Bedrock AgentCore Payments引入x402协议和稳定币支付，服务AI代理

编辑插图：Bedrock AgentCore Payments引入x402协议和稳定币支付，服务AI代理

AWS以预览版发布了Amazon Bedrock AgentCore Payments——首个面向自主AI代理支付的托管基础设施。该服务采用开放的x402 HTTP协议和稳定币，通过与Coinbase和Stripe（经由Privy）的合作实现，支持预算限额设置和通过AgentCore控制台进行完整的交易审计。

🟡 🤝 智能体 2026年5月8日 · 1 分钟阅读

arXiv:2605.05191: LongSeeker通过Context-ReAct框架在BrowseComp上达到61.5%

编辑插图：2605.05191: LongSeeker通过Context-ReAct框架在BrowseComp上达到61.5%

研究人员提出了LongSeeker——一种基于Context-ReAct框架的长时域搜索代理，具备五种动态上下文管理操作。该模型在BrowseComp基准测试上达到61.5%，领先Tongyi DeepResearch达18个百分点。

🟡 🤝 智能体 2026年5月8日 · 2 分钟阅读

CNCF: 用于Kubernetes Bug修复的AI智能体三种数据检索策略对比

Editorial illustration: 用于Kubernetes Bug修复的AI智能体三种数据检索策略对比

CNCF基准测试对比了RAG、混合和纯本地检索三种策略，用于AI智能体修复真实Kubernetes Bug。RAG速度最快（1分16秒），但关键瓶颈既非速度也非成本——而是「范围发现」，即智能体识别多个文件中所有受影响代码的能力。

🏥 实践应用 (1)

🟡 🏥 实践应用 2026年5月8日 · 2 分钟阅读

GitHub: 审查AI拉取请求的五大风险与10分钟评审框架

GitHub发布了AI生成代码审查实用指南，定义了五大关键风险并提出了结构化的10分钟代码审查框架。平台上超过五分之一的拉取请求现已涉及AI代理。

🛡️ 安全 (2)

🔴 🛡️ 安全 2026年5月8日 · 2 分钟阅读

OpenAI: GPT-5.5和GPT-5.5-Cyber扩展Trusted Access for Cyber计划

编辑插图：GPT-5.5和GPT-5.5-Cyber扩展Trusted Access for Cyber计划

OpenAI将Trusted Access for Cyber（TAC）计划扩展至数千名经过验证的防御型安全研究人员和数百个保护关键软件基础设施的团队。计划引入了限制较少的GPT-5.5，以及专门用于逆向工程和恶意软件分析的GPT-5.5-Cyber。

🟡 🛡️ 安全 2026年5月8日 · 2 分钟阅读

arXiv:2605.04572: SQSD揭示无害微调同样会损害模型安全性

该论文被ICML 2026接收，提出了SQSD方法——用于量化单个样本对模型安全性损害程度的贡献。研究人员证明，即使是看似无害的微调样本，也会累积地将参数推向「危险对齐」方向。

← 前一天后一天 →