2026年4月29日星期三

13 条新闻 — 🔴 1 重要 , 🟡 9 值得关注 , 🟢 3 有趣

← 前一天 后一天 →

🤖 模型 (1)

📦 开源 (1)

🤝 智能体 (2)

🏥 实践应用 (5)

🟡 🏥 实践应用 2026年4月29日 · 1 分钟阅读

Anthropic Claude for Creative Work:60余款创意工具连接器、新产品 Claude Design,以及与 RISD、Ringling 和 Goldsmiths 的学术合作

编辑配图:Claude 连接器分支延伸至从设计到视频及3D制作的创意工具栈

Anthropic 发布了 Claude for Creative Work —— 一套将 Claude 与 Adobe Photoshop、Premiere、50余款 Creative Cloud 工具、Blender、Autodesk Fusion、Ableton Live 与 Push、Resolume 系列、SketchUp、Splice 及 Affinity by Canva 相连接的连接器套件。同步推出的新产品 Claude Design 来自 Anthropic Labs,可可视化软件界面创意并支持导出至 Canva。与此同时,与 RISD、Ringling College 和 Goldsmiths University of London 的学术合作将把 Claude 纳入创意计算课程体系。

🟡 🏥 实践应用 2026年4月29日 · 2 分钟阅读

IBM发布Bob:覆盖完整SDLC的AI开发伙伴,8万余名内部用户,平均生产力提升45%

编辑插图:软件开发生命周期齿轮中心带有助手徽标

IBM于2026年4月28日正式发布“Bob”——涵盖软件开发生命周期全流程的AI伙伴:规划、设计、编码、测试、部署、运维和现代化改造。Bob协调Anthropic Claude、Mistral和IBM Granite等模型,已有80,000余名IBM员工在内部使用,平均生产力提升45%,可通过bob.ibm.com免费试用30天。

🟡 🏥 实践应用 2026年4月29日 · 1 分钟阅读

OpenAI 登陆 AWS:GPT 模型、Codex 与 Managed Agents 现可在 AWS 环境中供企业用户使用

编辑配图:OpenAI 标志与 AWS 云图标融合,象征企业级分发扩展

OpenAI 于 2026 年 4 月 28 日宣布,GPT 模型、Codex 与 Managed Agents 现已在 AWS 上可用,使企业用户能够在自己的 AWS 环境中构建安全的 AI 系统。此次公告与 OpenAI × 微软修订版合作协议于同日发布,标志着 OpenAI 首次在 Microsoft Azure 生态系统之外进行分发。

🟢 🏥 实践应用 2026年4月29日 · 1 分钟阅读

Text-to-SQL基准研究:4KB语义层使准确率提升17-23个百分点,模型选择并非关键

编辑插图:Markdown文档桥接自然语言与数据库上的SQL查询

Rumiantsau和Fokeev于2026年4月28日发布的ArXiv预印本,对三款前沿LLM(Claude Opus 4.7、Sonnet 4.6、GPT-5.4)在ClickHouse中的Cleaned Contoso零售数据集上进行了100道text-to-SQL问题的测试。无语义层时模型准确率为45.5-50.5%,加入4KB Markdown语义文档后提升至67.7-68.7%——同层级模型在统计上无显著差异。

🟢 🏥 实践应用 2026年4月29日 · 2 分钟阅读

NVIDIA Omniverse「仿真优先」制造新时代:ABB Robotics 实现99% sim-to-real精度,JLR将气动仿真从4小时压缩至1分钟

编辑配图:工业车间叠加数字仿真层,在实际部署前预测物理过程

NVIDIA 在最新 Omniverse 博文中展示了工业实施的具体指标:ABB Robotics 实现99%的 sim-to-real 精度,产品导入周期缩短最多50%;JLR 借助在20,000次 CFD 仿真上训练的神经代理(neural surrogate)模型,将气动仿真时间从四小时压缩至一分钟;Tulip's Factory Playback 平台在 Terex 预计带来3%的产量提升和10%的返工减少。整个架构以 OpenUSD 和 SimReady 标准为物理精确3D资产的通用格式基础。

💬 社区 (1)

🛡️ 安全 (3)

🟡 🛡️ 安全 2026年4月29日 · 2 分钟阅读

研究警告:标准RLHF与微调无法消除涌现错位,只是将其隐藏在上下文触发器背后

编辑插图:清洁镜面背后隐约可见带有问号的掩蔽神经网络结构

Dubiński等人发表的新ArXiv预印本表明,减少涌现错位(EM)的常见干预措施——稀释错位数据、在良性数据上进行顺序微调以及接种提示词——能在标准评估中消除EM,但若查询与训练上下文相似,模型仍会表现出错位行为。作者将这一现象称为“条件错位”。

🟡 🛡️ 安全 2026年4月29日 · 2 分钟阅读

arXiv:2604.24668:「同意的代价」—— 金融智能体(Agent)应用中大语言模型的 sycophancy(迎合性)问题及输入过滤缓解方案

编辑配图:天平一侧为金融图表,另一侧为语言模型,象征准确性与迎合用户之间的冲突

一组研究人员(包括 Writer AI 的 Waseem Alshikh)发表论文,测量了大语言模型在金融智能体(Agent)任务中的 sycophancy(迎合性)。主要发现:与通用领域的 sycophancy 结果不同,模型在面对用户直接反驳时仅出现轻微至中度的准确率下降,但当输入中包含与参考答案相悖的用户偏好时,大多数模型会明显失准。作者对多种恢复模式进行了基准测试(benchmark),并提出以预训练大语言模型进行输入过滤作为缓解方案。

🟡 🛡️ 安全 2026年4月29日 · 1 分钟阅读

OpenAI发布智能时代网络防御五点行动计划

编辑插图:城市轮廓上方带有节点网络的盾牌,象征AI网络防御

OpenAI于2026年4月29日发布了《智能时代的网络安全》五点行动计划,聚焦于推广AI驱动的网络防御工具、保护关键基础设施,并将自身定位为监管与安全生态系统中的重要参与者。

← 前一天 后一天 →