2026年4月29日星期三

13 条新闻 — 🔴 1 重要 , 🟡 9 值得关注 , 🟢 3 有趣

🤖 模型 (1)

🔴 🤖 模型 2026年4月29日 · 2 分钟阅读

NVIDIA Nemotron 3 Nano Omni：开源多模态（multimodal）30B-A3B MoE（混合专家）模型，支持256K上下文，吞吐量（throughput）比竞品高9倍

编辑配图：多模态（multimodal）AI系统通过混合专家（MoE）架构整合视频、音频与文本

Nemotron 3 Nano Omni 是 NVIDIA 推出的开源多模态（multimodal）模型，在一个30B-A3B混合专家（MoE）系统中统一了视觉、语音与语言能力，支持256K上下文。该模型在六项文档智能及音视频理解排行榜（leaderboard）上名列前茅，在保持相同交互性的前提下，吞吐量（throughput）比其他开源全模态模型高9倍。现已在HuggingFace、OpenRouter、NVIDIA NIM 及25个以上合作平台上提供；Foxconn、Palantir 等七家企业已在生产环境中使用。

📦 开源 (1)

🟡 📦 开源 2026年4月29日 · 2 分钟阅读

Marco-MoE：开源多语言MoE模型仅激活5%参数，超越激活参数量多3-14倍的密集模型

Marco-MoE是由Jiang、Zhao等人于2026年4月28日发布的新型开源稀疏混合专家模型系列。模型每个令牌仅激活约5%的总参数，通过从密集模型升级改造在5万亿令牌上训练，Instruct版本超越激活参数量多3至14倍的密集竞争对手。权重、数据集和训练方案均已公开发布。

🤝 智能体 (2)

🟡 🤝 智能体 2026年4月29日 · 2 分钟阅读

RecursiveMAS将递归计算从单模型扩展至多智能体系统：精度提升8.3%，令牌减少34-75%

RecursiveMAS是一种新型多智能体框架，通过轻量级RecursiveLink模块将递归计算（循环LLM）从单个模型扩展至多个协作智能体。在9个基准测试（数学、科学、医学、代码）中，平均精度提升8.3%，推理速度提升1.2-2.4倍，令牌消耗减少34.6-75.6%。

🟡 🤝 智能体 2026年4月29日 · 1 分钟阅读

AWS展示如何在Bedrock AgentCore Runtime上运行无服务器MCP代理以实现治理与审计

AWS于2026年4月29日发布了在Amazon Bedrock AgentCore Runtime上运行自定义Model Context Protocol（MCP）代理的参考架构。该代理位于AI智能体与上游MCP服务器之间，无需修改现有服务器即可添加治理、审计追踪和输入清洗功能。演示使用FastMCP和三层身份验证。

🏥 实践应用 (5)

🟡 🏥 实践应用 2026年4月29日 · 1 分钟阅读

Anthropic Claude for Creative Work：60余款创意工具连接器、新产品 Claude Design，以及与 RISD、Ringling 和 Goldsmiths 的学术合作

Anthropic 发布了 Claude for Creative Work —— 一套将 Claude 与 Adobe Photoshop、Premiere、50余款 Creative Cloud 工具、Blender、Autodesk Fusion、Ableton Live 与 Push、Resolume 系列、SketchUp、Splice 及 Affinity by Canva 相连接的连接器套件。同步推出的新产品 Claude Design 来自 Anthropic Labs，可可视化软件界面创意并支持导出至 Canva。与此同时，与 RISD、Ringling College 和 Goldsmiths University of London 的学术合作将把 Claude 纳入创意计算课程体系。

🟡 🏥 实践应用 2026年4月29日 · 2 分钟阅读

IBM发布Bob：覆盖完整SDLC的AI开发伙伴，8万余名内部用户，平均生产力提升45%

IBM于2026年4月28日正式发布“Bob”——涵盖软件开发生命周期全流程的AI伙伴：规划、设计、编码、测试、部署、运维和现代化改造。Bob协调Anthropic Claude、Mistral和IBM Granite等模型，已有80,000余名IBM员工在内部使用，平均生产力提升45%，可通过bob.ibm.com免费试用30天。

🟡 🏥 实践应用 2026年4月29日 · 1 分钟阅读

OpenAI 登陆 AWS：GPT 模型、Codex 与 Managed Agents 现可在 AWS 环境中供企业用户使用

OpenAI 于 2026 年 4 月 28 日宣布，GPT 模型、Codex 与 Managed Agents 现已在 AWS 上可用，使企业用户能够在自己的 AWS 环境中构建安全的 AI 系统。此次公告与 OpenAI × 微软修订版合作协议于同日发布，标志着 OpenAI 首次在 Microsoft Azure 生态系统之外进行分发。

🟢 🏥 实践应用 2026年4月29日 · 1 分钟阅读

Text-to-SQL基准研究：4KB语义层使准确率提升17-23个百分点，模型选择并非关键

Rumiantsau和Fokeev于2026年4月28日发布的ArXiv预印本，对三款前沿LLM（Claude Opus 4.7、Sonnet 4.6、GPT-5.4）在ClickHouse中的Cleaned Contoso零售数据集上进行了100道text-to-SQL问题的测试。无语义层时模型准确率为45.5-50.5%，加入4KB Markdown语义文档后提升至67.7-68.7%——同层级模型在统计上无显著差异。

🟢 🏥 实践应用 2026年4月29日 · 2 分钟阅读

NVIDIA Omniverse「仿真优先」制造新时代：ABB Robotics 实现99% sim-to-real精度，JLR将气动仿真从4小时压缩至1分钟

NVIDIA 在最新 Omniverse 博文中展示了工业实施的具体指标：ABB Robotics 实现99%的 sim-to-real 精度，产品导入周期缩短最多50%；JLR 借助在20,000次 CFD 仿真上训练的神经代理（neural surrogate）模型，将气动仿真时间从四小时压缩至一分钟；Tulip's Factory Playback 平台在 Terex 预计带来3%的产量提升和10%的返工减少。整个架构以 OpenUSD 和 SimReady 标准为物理精确3D资产的通用格式基础。

💬 社区 (1)

🟢 💬 社区 2026年4月29日 · 1 分钟阅读

CNCF调查：近50%开源贡献者使用AI助手，2/3项目缺乏正式指导方针

CNCF TAG开发者体验于2026年4月29日发布了CNCF项目中AI工具使用情况调查的首批结果：来自近100个项目的133名参与者。近半数积极在IDE中使用AI助手（Claude Code和GitHub Copilot居主导），约三分之二的项目没有正式的AI指导方针，超过半数参与者认为应始终标注AI贡献。

🛡️ 安全 (3)

🟡 🛡️ 安全 2026年4月29日 · 2 分钟阅读

研究警告：标准RLHF与微调无法消除涌现错位，只是将其隐藏在上下文触发器背后

Dubiński等人发表的新ArXiv预印本表明，减少涌现错位（EM）的常见干预措施——稀释错位数据、在良性数据上进行顺序微调以及接种提示词——能在标准评估中消除EM，但若查询与训练上下文相似，模型仍会表现出错位行为。作者将这一现象称为“条件错位”。

🟡 🛡️ 安全 2026年4月29日 · 2 分钟阅读

arXiv:2604.24668：「同意的代价」—— 金融智能体（Agent）应用中大语言模型的 sycophancy（迎合性）问题及输入过滤缓解方案

一组研究人员（包括 Writer AI 的 Waseem Alshikh）发表论文，测量了大语言模型在金融智能体（Agent）任务中的 sycophancy（迎合性）。主要发现：与通用领域的 sycophancy 结果不同，模型在面对用户直接反驳时仅出现轻微至中度的准确率下降，但当输入中包含与参考答案相悖的用户偏好时，大多数模型会明显失准。作者对多种恢复模式进行了基准测试（benchmark），并提出以预训练大语言模型进行输入过滤作为缓解方案。

🟡 🛡️ 安全 2026年4月29日 · 1 分钟阅读

OpenAI发布智能时代网络防御五点行动计划

OpenAI于2026年4月29日发布了《智能时代的网络安全》五点行动计划，聚焦于推广AI驱动的网络防御工具、保护关键基础设施，并将自身定位为监管与安全生态系统中的重要参与者。

← 前一天后一天 →