Google:Gemini 3.5 Flash与Pro——迄今最快的前沿模型
Google在Google I/O 2026发布Gemini 3.5 Flash和Pro——速度比竞争对手快4倍的前沿模型,重点强调智能体任务、面向开发者的全新Antigravity 2.0平台,以及全天候运行的个人AI智能体Gemini Spark。
18 条新闻 — 🔴 2 重要 , 🟡 10 值得关注 , 🟢 6 有趣
Google在Google I/O 2026发布Gemini 3.5 Flash和Pro——速度比竞争对手快4倍的前沿模型,重点强调智能体任务、面向开发者的全新Antigravity 2.0平台,以及全天候运行的个人AI智能体Gemini Spark。
Google在I/O 2026发布Gemini Omni Flash——新款多模态模型,可从图像、音频、视频和文本的组合中生成和编辑视频。即日起在YouTube Shorts可用,每个生成片段均附带SynthID数字水印。
Google在《自然》杂志发表ERA(实证研究助手)——基于Gemini的系统,通过树搜索评估数千种计算方法并自动化编写专业科学软件。Computational Discovery平台已向研究人员开放,通过Google Labs提供访问。
研究人员发布了OScaR,一种解决大型语言模型KV缓存量化根本问题的方法。采用INT2精度——每个数值仅用2比特——实现了几乎无损的精度、3倍解码加速、5.3倍内存压缩,以及与BF16 FlashDecoding-v2相比4.1倍的吞吐量提升。
Google DeepMind与新加坡政府签署国家AI合作协议,覆盖医疗、教育与可持续发展领域。预计到2040年,AI的应用将通过加速研发为新加坡经济额外带来25亿美元的增长。
OpenAI正式进入「Education for Countries」全球教育计划第二阶段——扩大与各国政府的合作,推出OpenAI Luminaries教师参与项目,并通过OpenAI Academy颁发AI认证。目标是将AI工具系统性融入国家教育体系,并以可量化的方式评估实际效果。
OECD.AI和EU AI Office记录了欧洲在四个战略领域部署AI的情况:农业、医疗、工业和交通。Robs4Crops、欧洲癌症影像计划和AI4Cities等项目已在进行中,但数据碎片化和数字技能不足阻碍了更广泛的应用。
Claude Code v2.1.145新增JSON格式实时会话列表输出功能,扩展了OTEL追踪属性以跟踪智能体,并修复了Bash命令授权时的安全漏洞。可通过npm install -g @anthropic-ai/claude-code获取更新。
Anthropic与KPMG签署战略全球联盟,Claude将覆盖全球四大会计师事务所之一的全体员工。Claude将集成至KPMG数字网关平台,KPMG同时成为Anthropic在私募股权领域的首选合作伙伴。
AWS发布了使用Amazon Nova Sonic和AgentCore Gateway构建可扩展语音智能体的详细指南。三种架构模式——直接工具、子智能体和会话分段——提供不同的延迟与操作复杂性权衡。
Google的Gemini 3.5 Flash模型正式面向所有GitHub Copilot计划全面开放。该模型承诺以Flash层级的速度和更低成本提供接近Pro级别的代码质量,并特别强调对智能体工作流和多IDE环境的支持。
EnvFactory是一种自动合成可执行训练环境的新框架,专为工具调用智能体设计。在Qwen3模型上,仅使用85个验证环境即可在BFCLv3上实现+15%、在MCP-Atlas上实现+8.6%的提升——比同类方法少五倍的环境数量。
LongMINT是首个测量AI智能体在长期动态场景中记忆管理能力的基准。包含15,600个问答对,上下文最长达180万个token,被测系统平均准确率仅为27.9%——在大量案例中低于随机猜测。
新发布的arXiv论文引入「随机-确定性边界」作为生产级LLM智能体的核心设计原则,并定义了6种可组合的运行时模式——从分层委派到人机协作——根据三个架构关切进行选择:协调、状态与控制。
新研究证明,基于提示词的限制仅能将未授权工具调用率降低11–18%,而带ABAC的架构层MCP代理能以低于50ms的延迟实现完全保护。该研究计划在EMNLP 2026工业赛道发表。
CNCF Falco团队发布了Prempti——一个实验性项目,将Falco的运行时安全模型扩展至AI编程智能体领域。该系统在工具调用执行前进行拦截并应用策略规则,使团队能够管控Claude Code等智能体的操作行为。
IBM发布了面向企业客户的最先进AI驱动安全组合,通过Project Glasswing工作得到加强——与Anthropic合作的行业联盟,可自主检测和响应AI攻击。新IBM Autonomous Security组合覆盖完整威胁生命周期。