Google:Gemini 3.5 Flash与Pro——迄今最快的前沿模型
Google在Google I/O 2026发布Gemini 3.5 Flash和Pro——速度比竞争对手快4倍的前沿模型,重点强调智能体任务、面向开发者的全新Antigravity 2.0平台,以及全天候运行的个人AI智能体Gemini Spark。
本文由人工智能基于一手来源生成。
Google I/O 2026:Gemini 3.5 Flash即日起可用,Pro即将推出
Google在Google I/O 2026大会上发布了Gemini 3.5 Flash,这款新前沿模型从今天起可在Gemini应用、Google搜索和Gemini API中使用。其大哥Gemini 3.5 Pro目前正在内部测试,将于下月扩大分发。
核心主张:Gemini 3.5 Flash生成输出token的速度比其他前沿模型快四倍,据Google称运行成本不到竞争对手的一半。在Terminal-Bench 2.1基准测试中,该模型达到76.2%,甚至超越了Gemini 3.1 Pro,而在GDPval-AA智能体评估中获得1656 Elo分。
什么是智能体AI,为何现在是优先事项?
智能体AI是指能在无需用户持续监督的情况下自主规划和执行一系列操作的系统——搜索网络、编写代码、调用外部服务并在单一任务中做出决策。与回答单个问题的传统聊天机器人不同,智能体模型可以在数十个步骤中推进项目。
Gemini 3.5 Flash正是为此类场景设计的。当模型需要在短时间内完成数百次小型调用时,高执行速度至关重要,一个步骤出错可以迅速重试,无需长时间等待。
Gemini Spark:全天候运行的个人AI智能体
Gemini Spark是一种新型产品——基于Gemini 3.5 Flash的持久个人AI智能体,持续监控和组织用户的数字生活。该智能体可以安排会议、汇总邮件、跟踪截止日期,并在无需任何手动查询的情况下主动提醒变化。
Spark目前正在精选用户中测试,测试版将于下周向Google AI Ultra计划订阅用户在美国推出。预计年底2026年夏末向更广泛的全球受众开放。
Antigravity 2.0与新TPU芯片
Antigravity 2.0是Google用于构建智能体应用的开发平台。此次升级带来了子智能体的并行运行——这意味着单个用户请求可以同时启动多个协调工作的专业智能体。该平台可通过Gemini API、AI Studio和Android Studio访问。
这一切背后是新一代TPU v8t和v8i第八代芯片——TPU v8t针对大模型训练优化,TPU v8i针对快速推理优化。正是这些芯片的组合解释了为何Gemini 3.5 Flash能在不牺牲精度的情况下实现4倍速度提升。
已在生产中测试Gemini 3.5 Flash的合作伙伴包括Shopify、Salesforce、麦格理银行和Databricks——这表明该模型在实验室条件以外已准备好用于商业应用。
常见问题
- 什么是Gemini 3.5 Flash,与之前的模型有何不同?
- Gemini 3.5 Flash是Google最新的前沿模型,于2026年5月19日发布。在每秒输出token数方面,速度是竞争对手前沿模型的四倍。根据Terminal-Bench 2.1基准测试,成绩达76.2%,甚至超越了旧版Gemini 3.1 Pro。
- 什么是Gemini Spark,面向哪些用户?
- Gemini Spark是以Gemini 3.5 Flash为基础、全天候24/7运行的个人AI智能体。面向数字生活管理——从日历组织到执行多步骤任务。测试版将于下周向美国Google AI Ultra计划订阅用户推出。
- 什么是Antigravity 2.0,为何对开发者重要?
- Antigravity 2.0是Google的开发平台,支持并行运行子智能体、自动化多步骤工作流以及可靠执行复杂编码任务。可通过Gemini API和Google AI Studio访问,从今天起支持Gemini 3.5 Flash。