2026年5月20日星期三

18 条新闻 — 🔴 2 重要 , 🟡 10 值得关注 , 🟢 6 有趣

🤖 模型 (4)

🔴 🤖 模型 2026年5月20日 · 2 分钟阅读

Google：Gemini 3.5 Flash与Pro——迄今最快的前沿模型

Editorial illustration: Google je na Google I/O 2026 predstavio Gemini 3.5 Flash i Pro — frontier modele koji su 4× brži od

Google在Google I/O 2026发布Gemini 3.5 Flash和Pro——速度比竞争对手快4倍的前沿模型，重点强调智能体任务、面向开发者的全新Antigravity 2.0平台，以及全天候运行的个人AI智能体Gemini Spark。

🔴 🤖 模型 2026年5月20日 · 2 分钟阅读

Google：Gemini Omni Flash带来多模态输入的原生视频生成

Editorial illustration: Google je na I/O 2026 predstavio Gemini Omni Flash — novi multimodalni model koji generira i uređuje

Google在I/O 2026发布Gemini Omni Flash——新款多模态模型，可从图像、音频、视频和文本的组合中生成和编辑视频。即日起在YouTube Shorts可用，每个生成片段均附带SynthID数字水印。

🟡 🤖 模型 2026年5月20日 · 2 分钟阅读

Google：ERA——自动化科学代码编写的AI系统

Google在《自然》杂志发表ERA（实证研究助手）——基于Gemini的系统，通过树搜索评估数千种计算方法并自动化编写专业科学软件。Computational Discovery平台已向研究人员开放，通过Google Labs提供访问。

🟢 🤖 模型 2026年5月20日 · 2 分钟阅读

arXiv:2605.19660：OScaR — INT2量化KV缓存实现3倍解码加速

Editorial illustration: Istraživači su objavili OScaR, metodu koja rješava temeljni problem kvantizacije KV cachea u velikim

研究人员发布了OScaR，一种解决大型语言模型KV缓存量化根本问题的方法。采用INT2精度——每个数值仅用2比特——实现了几乎无损的精度、3倍解码加速、5.3倍内存压缩，以及与BF16 FlashDecoding-v2相比4.1倍的吞吐量提升。

📦 开源 (1)

🟢 📦 开源 2026年5月20日 · 1 分钟阅读

LangChain：修复智能体的智能体——LangSmith Engine的构建方式

LangChain发布了LangSmith Engine技术详解——一款分析生产AI智能体错误并提出具体修复方案的自主元智能体。Engine端到端自动化错误检测、评估器生成和回归测试。

⚖️ 监管 (3)

🟡 ⚖️ 监管 2026年5月20日 · 2 分钟阅读

Google DeepMind与新加坡：涵盖医疗、教育与环境的国家AI合作伙伴关系

Editorial illustration: Google DeepMind potpisao je nacionalno AI partnerstvo sa singapurskom vladom koje pokriva zdravstvo,

Google DeepMind与新加坡政府签署国家AI合作协议，覆盖医疗、教育与可持续发展领域。预计到2040年，AI的应用将通过加速研发为新加坡经济额外带来25亿美元的增长。

🟡 ⚖️ 监管 2026年5月20日 · 2 分钟阅读

OpenAI：面向国家的AI教育计划进入新阶段

Editorial illustration: OpenAI ulazi u drugu fazu inicijative Education for Countries — proširuje partnerstva s vladama, uvo

OpenAI正式进入「Education for Countries」全球教育计划第二阶段——扩大与各国政府的合作，推出OpenAI Luminaries教师参与项目，并通过OpenAI Academy颁发AI认证。目标是将AI工具系统性融入国家教育体系，并以可量化的方式评估实际效果。

🟢 ⚖️ 监管 2026年5月20日 · 1 分钟阅读

OECD：欧盟将AI引入战略性重要领域——这对公民意味着什么？

OECD.AI和EU AI Office记录了欧洲在四个战略领域部署AI的情况：农业、医疗、工业和交通。Robs4Crops、欧洲癌症影像计划和AI4Cities等项目已在进行中，但数据碎片化和数字技能不足阻碍了更广泛的应用。

🤝 智能体 (7)

🟡 🤝 智能体 2026年5月20日 · 2 分钟阅读

Anthropic Claude Code：v2.1.145版本带来实时会话脚本化与安全修复

Claude Code v2.1.145新增JSON格式实时会话列表输出功能，扩展了OTEL追踪属性以跟踪智能体，并修复了Bash命令授权时的安全漏洞。可通过npm install -g @anthropic-ai/claude-code获取更新。

🟡 🤝 智能体 2026年5月20日 · 2 分钟阅读

Anthropic：Claude服务KPMG全球138个国家的276,000名员工

Editorial illustration: Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenic

Anthropic与KPMG签署战略全球联盟，Claude将覆盖全球四大会计师事务所之一的全体员工。Claude将集成至KPMG数字网关平台，KPMG同时成为Anthropic在私募股权领域的首选合作伙伴。

🟡 🤝 智能体 2026年5月20日 · 2 分钟阅读

AWS：Amazon Nova Sonic可扩展语音智能体的三种架构模式

AWS发布了使用Amazon Nova Sonic和AgentCore Gateway构建可扩展语音智能体的详细指南。三种架构模式——直接工具、子智能体和会话分段——提供不同的延迟与操作复杂性权衡。

🟡 🤝 智能体 2026年5月20日 · 2 分钟阅读

GitHub Copilot接入Gemini 3.5 Flash：为日常编程带来速度与质量

Editorial illustration: Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kv

Google的Gemini 3.5 Flash模型正式面向所有GitHub Copilot计划全面开放。该模型承诺以Flash层级的速度和更低成本提供接近Pro级别的代码质量，并特别强调对智能体工作流和多IDE环境的支持。

🟢 🤝 智能体 2026年5月20日 · 1 分钟阅读

arXiv:2605.18703：EnvFactory——以1/5的环境数量训练工具调用智能体，性能提升15%

EnvFactory是一种自动合成可执行训练环境的新框架，专为工具调用智能体设计。在Qwen3模型上，仅使用85个验证环境即可在BFCLv3上实现+15%、在MCP-Atlas上实现+8.6%的提升——比同类方法少五倍的环境数量。

🟢 🤝 智能体 2026年5月20日 · 1 分钟阅读

arXiv:2605.18565：LongMINT——揭示AI智能体为何「遗忘」所有信息

LongMINT是首个测量AI智能体在长期动态场景中记忆管理能力的基准。包含15,600个问答对，上下文最长达180万个token，被测系统平均准确率仅为27.9%——在大量案例中低于随机猜测。

🟢 🤝 智能体 2026年5月20日 · 2 分钟阅读

arXiv:2605.20173：生产级LLM智能体的6种架构模式

Editorial illustration: Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM

新发布的arXiv论文引入「随机-确定性边界」作为生产级LLM智能体的核心设计原则，并定义了6种可组合的运行时模式——从分层委派到人机协作——根据三个架构关切进行选择：协调、状态与控制。

🛡️ 安全 (3)

🟡 🛡️ 安全 2026年5月20日 · 2 分钟阅读

arXiv:2605.18414：提示词无法保护——带ABAC的MCP代理实现0%未授权工具调用

新研究证明，基于提示词的限制仅能将未授权工具调用率降低11–18%，而带ABAC的架构层MCP代理能以低于50ms的延迟实现完全保护。该研究计划在EMNLP 2026工业赛道发表。

🟡 🛡️ 安全 2026年5月20日 · 2 分钟阅读

CNCF Prempti：为AI编程智能体提供策略执行与可视化能力

Editorial illustration: CNCF Falco tim objavio je Prempti — eksperimentalni projekt koji proširuje Falcov model runtime sigu

CNCF Falco团队发布了Prempti——一个实验性项目，将Falco的运行时安全模型扩展至AI编程智能体领域。该系统在工具调用执行前进行拦截并应用策略规则，使团队能够管控Claude Code等智能体的操作行为。

🟡 🛡️ 安全 2026年5月20日 · 2 分钟阅读

IBM：Project Glasswing为企业带来最先进的AI驱动安全组合

IBM发布了面向企业客户的最先进AI驱动安全组合，通过Project Glasswing工作得到加强——与Anthropic合作的行业联盟，可自主检测和响应AI攻击。新IBM Autonomous Security组合覆盖完整威胁生命周期。

← 前一天后一天 →