Google: Gemini 3.1 Flash-Lite正式进入全面可用阶段
Gemini 3.1 Flash-Lite自2026年5月7日起通过Gemini API正式进入全面可用(GA)阶段,作为稳定的生产端点。该模型针对速度、规模和成本效率进行了优化,预览版将于2026年5月25日停止服务。
本文由人工智能基于一手来源生成。
Google于2026年5月7日宣布,Gemini 3.1 Flash-Lite模型已通过Gemini API从预览阶段正式进入全面可用(GA)状态。稳定端点标识符为gemini-3.1-flash-lite,可在生产工作负载中无限制使用,不再受预览状态的约束。
GA版本带来什么?
根据官方更新日志,该模型「针对速度、规模和成本效率进行了优化」。这是Gemini 3.1系列中成本最低的端点,面向开发团队需要处理大量请求且每次调用延迟是关键参数的场景。典型使用场景包括分类、结构化数据提取、轻量级聊天应用以及大型语料库的预处理。
预览版将在两周内停止服务
此前使用gemini-3.1-flash-lite-preview的开发团队必须迁移至稳定标识符。Google表示预览版「将于2026年5月11日进入弃用阶段,并于2026年5月25日完全停止服务」。迁移操作实际上只需替换客户端配置中的一个字符串——预览版与GA版本的模型行为应保持一致。
在Gemini 3.1系列中的定位
Flash-Lite填补了Gemini 3.1系列价格阶梯的低端,位于标准Flash和Pro版本之下。GA状态意味着Google正式承担API合约和模型行为稳定性的SLA义务,这是将其纳入商业合同和受监管行业的前提条件。
对开发团队意味着什么?
一直等待GA版本才正式投入生产的团队现在获得了稳定的合约基础。已在使用预览版的团队距离该端点完全停止服务不足三周,必须尽快更新配置。
常见问题
- 模型的确切标识符是什么?
- 稳定端点标识符为「gemini-3.1-flash-lite」,通过Gemini API标准接口访问。
- 预览版何时停止服务?
- 预览端点「gemini-3.1-flash-lite-preview」将于2026年5月11日进入弃用阶段,并于2026年5月25日完全停止服务。
- 该模型适用于哪些场景?
- Google将其定位为高流量应用的经济型生产选项,适用于速度和单位成本至关重要的场景。