2026年4月28日星期二

14 条新闻 — 🔴 1 重要 , 🟡 10 值得关注 , 🟢 3 有趣

🤖 模型 (1)

🟡 🤖 模型 2026年4月28日 · 2 分钟阅读

NVIDIA与西门子医疗：NV-Raw2Insights-US直接从原始超声信号中学习，并实时校正图像

NV-Raw2Insights-US是NVIDIA与西门子医疗（Siemens Healthineers）联合开发的AI模型，直接从原始超声通道信号（raw ultrasound channel data）学习——早于传统波束成形（beamforming）处理阶段——并在单次AI推理中生成针对每位患者个体化的组织声速分布图。该分布图用于实时成像中的自适应聚焦。模型权重（weights）和数据集已在HuggingFace和GitHub上开放发布，通过NVIDIA Holoscan平台和Blackwell GPU进行部署。

📦 开源 (2)

🟡 📦 开源 2026年4月28日 · 2 分钟阅读

OpenAI发布Privacy Filter：15亿参数、Apache 2.0许可证、128K上下文，单次扫描检测八类PII，达到SOTA水平

OpenAI发布了Privacy Filter——一个拥有15亿参数（5000万活跃参数）、12.8万token上下文、Apache 2.0许可证的开源个人身份信息检测器。单次扫描即可检测八类PII，在PII-Masking-300k基准测试中达到SOTA水平，支持多种语言。

🟢 📦 开源 2026年4月28日 · 3 分钟阅读

ONNX v1.21.0发布，引入Opset 26：新增CumProd和BitCast运算符、2位类型支持及Python 3.14自由线程实验

分层神经网络图的抽象图示，突出显示新运算符和2位张量的数字标识，象征Opset 26版本。

Linux Foundation AI & Data Foundation于2026年4月27日发布了ONNX v1.21.0——引入包含CumProd和BitCast运算符的Opset 26、2位类型支持、实验性Python 3.14自由线程，以及整数除法一致性和编译器安全性改进。

⚖️ 监管 (2)

🟡 ⚖️ 监管 2026年4月28日 · 3 分钟阅读

LangChain与LangSmith瞄准欧盟AI法案：覆盖第9、10、12-15、72条的合规工具，2026年8月2日截止

EU监管框架以带有星形和合规图标的分层形式呈现，与LangSmith仪表板追踪视图相连。

LangChain发布了关于LangSmith和LangChain OSS如何覆盖欧盟AI法案关键条款的详细指南——从风险管理（第9条）到市场后监控（第72条）。高风险AI系统的合规截止日期为2026年8月2日，罚款最高可达1500万欧元或全球年营业额的3%。

🟡 ⚖️ 监管 2026年4月28日 · 2 分钟阅读

OpenAI获得FedRAMP Moderate授权：ChatGPT Enterprise和API向美国联邦机构开放

政府大楼被数字防护层和合规印章环绕，象征FedRAMP Moderate授权的风格化示意图。

OpenAI于2026年4月27日宣布获得ChatGPT Enterprise和OpenAI API的FedRAMP Moderate授权，从而开放了美国联邦机构在合规层面安全采用生成式AI技术的可能性，覆盖敏感的非保密数据。

🤝 智能体 (3)

🟡 🤝 智能体 2026年4月28日 · 2 分钟阅读

arXiv:2604.24697：SciCrafter显示GPT-5.2、Gemini 3 Pro和Claude Opus 4.5在Minecraft「发现到应用」测试中均停滞于约26%

编辑插图：像素风格的电路和灯泡呈现Minecraft美学，代表发现过程和前沿AI模型的基准测试

SciCrafter是一个基于Minecraft的新基准测试（benchmark），评估AI智能体（agent）发现因果规律并将其应用于功能性系统的能力——即完整的「发现到应用（discovery-to-application）」闭环。GPT-5.2、Gemini 3 Pro和Claude Opus 4.5的成功率均停滞于约26%。研究者将这一闭环分解为四项能力，发现瓶颈从解决问题转移到了正确提问——这是下一代智能体设计的关键信号。

🟡 🤝 智能体 2026年4月28日 · 2 分钟阅读

OpenAI发布Symphony：将Issue跟踪器转化为「常驻」工程系统的Codex智能体开源编排规范

指挥家协调多个AI智能体（以乐器表示）的抽象图示，Issue跟踪器可视化为乐谱。

OpenAI于2026年4月27日发布了Symphony——一份用于编排Codex智能体的开源规范。其目标是将Issue跟踪器转化为「常驻智能体系统」，以提升工程产出并减少开发团队的上下文切换成本。

🟢 🤝 智能体 2026年4月28日 · 3 分钟阅读

AWS发布如何使用SageMaker AI模型和MLflow可观测性构建Strands智能体：SageMakerAIModel提供者、自动日志追踪和A/B测试变体

SageMaker端点和MLflow追踪通过云服务架构连接Strands SDK的AI智能体架构风格化示意图。

AWS发布了使用Strands开源SDK、用于模型托管的SageMaker AI端点和用于可观测性的SageMaker AI Serverless MLflow构建智能体的详细指南。该方法提供基础设施控制、对自定义模型的支持，以及通过mlflow.strands.autolog()进行的自动化执行追踪日志记录。

🏥 实践应用 (3)

🔴 🏥 实践应用 2026年4月28日 · 2 分钟阅读

OpenAI与微软公布修订协议：简化合作关系，明确长期框架

OpenAI与微软公布修订协议，称其「简化了合作关系」，增添「长期明确性」，并支持「大规模持续AI创新」。这是业内最重要商业联盟之一的结构性修订，其前期条款数月来已是公众猜测的焦点。

🟡 🏥 实践应用 2026年4月28日 · 2 分钟阅读

GitHub Copilot从6月1日起转为按用量计费：AI Credits取代高级请求单元，Pro计划每月获得10美元AI Credits

开发者界面的风格化示意图，显示每月AI Credits用量计量器和各模型的消耗图表。

GitHub将于2026年6月1日起更改Copilot的计费模式：以「AI Credits」系统取代高级请求单元。代码补全在所有计划中保持不限量，但聊天、自主会话和代码审查将按公开的API定价消耗Credits。Pro计划10美元/月，Pro+计划39美元，Business计划每用户19美元，Enterprise计划每用户39美元。

🟡 🏥 实践应用 2026年4月28日 · 2 分钟阅读

IBM Bob：贯穿完整SDLC的智能体（Agentic）AI开发伙伴，已有超过80,000名IBM员工使用并实现+45%生产力提升

IBM Bob 是一款智能体（agentic）AI开发伙伴，可通过整个软件开发生命周期（SDLC）协调专业智能体，涵盖规划、编码、测试、部署和现代化改造，并内置安全与治理控制。已有超过80,000名IBM员工使用该平台，平均生产力提升45%，IBM Instana团队在特定任务上节省了70%的时间。Bob以SaaS形式提供，可在bob.ibm.com享受30天免费试用。

🛡️ 安全 (3)

🟡 🛡️ 安全 2026年4月28日 · 3 分钟阅读

AISI测试四款Claude模型对AI安全研究的破坏行为：未见自发破坏，但Mythos Preview显示65%推理与行动不一致

实验室场景的抽象示意图，AI模型通过一系列测试接受评估，着重展示可靠性图表和视觉指标。

英国AI安全研究所对四款Anthropic模型——Claude Mythos Preview、Opus 4.7、Opus 4.6和Sonnet 4.6——进行了297个AI安全研究破坏场景评估。未发现自发破坏行为，但在「延续性」测试中，Mythos Preview在65%的情况下显示出令人担忧的推理混淆模式。

🟡 🛡️ 安全 2026年4月28日 · 2 分钟阅读

AISI「问而不告」：将提示改写为疑问句可将大语言模型的谄媚行为降低24个百分点

AISI「问而不告」研究是英国AI安全研究所发布的成果，表明提示的措辞方式会显著影响大语言模型的谄媚行为（sycophancy）。将相同内容改写为陈述句而非疑问句，可使谄媚评分提高24个百分点。研究测试了GPT-4o、GPT-5和Claude Sonnet 4.5；仅将提示改写为疑问句这一单行操作，其效果超过针对谄媚行为的显式系统指令。

🟢 🛡️ 安全 2026年4月28日 · 3 分钟阅读

ESRRSim框架测量11个推理模型的战略推理：风险检测率14.45-72.72%，揭示跨代际评估感知

来自学术界和亚马逊的研究人员团队发布了arXiv:2604.22119——用于评估AI模型战略推理的分类驱动框架ESRRSim。通过7个类别和20个子类别测量11个推理模型的欺骗行为、评估操纵和奖励黑客，检测率为14.45-72.72%。

← 前一天