Amazon Nova 2 Sonic: 端到端延迟低于500毫秒、音频延迟低于30毫秒的语音到语音基础模型
Amazon Nova 2 Sonic是第二代语音到语音基础模型,于2026年5月14日通过Amazon Bedrock发布。消除了对独立语音转文字和文字转语音服务的需求——端到端延迟低于500毫秒,通过Stream边缘网络音频延迟低于30毫秒,原生轮次检测、打断支持及对话中的函数调用。Stream Vision Agents框架抽象了双向音频流管理。
15 条新闻 — 🟡 10 值得关注 , 🟢 5 有趣
Amazon Nova 2 Sonic是第二代语音到语音基础模型,于2026年5月14日通过Amazon Bedrock发布。消除了对独立语音转文字和文字转语音服务的需求——端到端延迟低于500毫秒,通过Stream边缘网络音频延迟低于30毫秒,原生轮次检测、打断支持及对话中的函数调用。Stream Vision Agents框架抽象了双向音频流管理。
OpenDeepThink 是由 Shang Zhou 及合作者于 2026 年 5 月 14 日在 arXiv 上发布的新型基于种群的测试时计算扩展方法。该框架并行采样多个推理候选方案,通过逐对 Bradley-Terry 比较(而非逐点 LLM 评判)选出最佳结果。结果:Gemini 3.1 Pro 经过 8 轮序列 LLM 调用(约 27 分钟),在 Codeforces 基准测试中获得 +405 Elo 提升。团队还发布了包含 73 道专家评分 Codeforces 题目的 CF-73 数据集。
Orchard 是一个新的开源智能体建模框架,由 Baolin Peng、Wenlin Yao 及 12 位联合作者于 2026 年 5 月 14 日发布在 arXiv 上。该框架将轻量级环境层与三种专用训练方案相结合——SWE(软件工程)、GUI(视觉语言)和 Claw(个人助理)。Orchard-SWE 变体经强化学习训练后在 SWE-bench Verified 上达到 67.5%,成为编码智能体领域最先进的开源方案。
LangChain Labs是由Harrison Chase于2026年5月14日宣布的新应用研究项目,旨在从运营数据——生产追踪、用户反馈和评估结果——中自主改进代理。LangSmith作为收集追踪信号的骨干系统。初始合作伙伴包括Harvey(法律AI)、NVIDIA(GPU/基础设施)、Prime Intellect(分布式计算)、Fireworks(推理)和Baseten(部署)。
Claude Code v2.1.142 是 Anthropic CLI 智能体的新版本,于 2026 年 5 月 14 日发布。本周第四个补丁,继 v2.1.139、v2.1.140 和 v2.1.141 之后。新增八个用于 claude agents 后台会话的标志(--add-dir、--settings、--mcp-config、--plugin-dir、--permission-mode、--model、--effort、--dangerously-skip-permissions)。Fast Mode 默认模型现已切换至 Opus 4.7(原为 Opus 4.6)。修复 MCP 工具超时、git worktree 识别、macOS 睡眠守护进程及 Windows 网络驱动器死锁问题。
GitHub Copilot App是于2026年5月14日发布的技术预览版全新独立GitHub原生桌面应用程序。与IDE插件不同,它为每个任务提供独立会话——每个会话拥有自己的分支、文件、对话状态和任务状态。Agent Merge功能自主处理审查评论、修复失败检查并在满足条件后合并。Copilot Pro/Pro+用户可通过早期访问使用,Business/Enterprise用户将通过逐步推出获得访问权限。
OpenAI Codex随处可用是于2026年5月14日宣布的编程代理移动端和Web端新推出阶段。开发者可通过智能手机和平板电脑上的ChatGPT移动应用实时监控、引导和审批编程任务。该方式将Codex从Windows沙盒(5月13日)和Codex CLI部署扩展至异构计算环境,完成OpenAI跨平台战略。
Amazon Lex Assisted NLU是于2026年5月14日发布的LLM驱动聊天机器人新模式,在传统Lex NLU基础上增加大型语言模型能力。平均实现92%意图分类准确率和84%槽位解析准确率,真实部署中意图分类提升11-15%,回退响应减少23.5%。提供两种模式——主要模式(每次输入)和回退模式(仅低置信度时)——包含在标准Lex价格中。
GitHub Copilot Cloud Agent自动模型选择是于2026年5月14日发布的新功能,根据系统健康状况和模型性能信号自动为任务选择最优模型。使用自动模式的用户可享受标准模型倍增系数10%折扣,且不受每周使用频率限制。该功能消除了手动选择模型的需要,解决了企业用户在一周结束前触及使用上限的常见痛点。
IBM Forward Deployed Units(FDUs)是由Mohamad Ali(IBM咨询高级副总裁)于2026年5月14日发布的新企业咨询模式。6人小组——高级顾问、工程师和AI代理——取代传统30人咨询团队。该模式引入持续参与替代一次性项目逻辑。已在利雅得航空、雀巢、喜力和培生进行实际部署。
OpenAI Sea Codex 案例研究是于 2026 年 5 月 14 日发布的企业部署文章,Sea Limited(Garena 和 Shopee 品牌母公司)首席产品官在文中阐述了在亚洲工程团队中推广 OpenAI Codex 编码智能体的战略。Sea 将 Codex 定位为 AI 原生软件开发工具——这是对工作流程的根本性变革,而非仅仅加速既有实践的开发辅助工具。