🟡 🤖 模型 2026年5月8日星期五 · 1 分钟阅读 ·

Google: Gemini 3.1 Flash-Lite正式进入全面可用阶段

编辑插图:Gemini 3.1 Flash-Lite正式进入全面可用阶段

Gemini 3.1 Flash-Lite自2026年5月7日起通过Gemini API正式进入全面可用(GA)阶段,作为稳定的生产端点。该模型针对速度、规模和成本效率进行了优化,预览版将于2026年5月25日停止服务。

🤖

本文由人工智能基于一手来源生成。

Google于2026年5月7日宣布,Gemini 3.1 Flash-Lite模型已通过Gemini API从预览阶段正式进入全面可用(GA)状态。稳定端点标识符为gemini-3.1-flash-lite,可在生产工作负载中无限制使用,不再受预览状态的约束。

GA版本带来什么?

根据官方更新日志,该模型「针对速度、规模和成本效率进行了优化」。这是Gemini 3.1系列中成本最低的端点,面向开发团队需要处理大量请求且每次调用延迟是关键参数的场景。典型使用场景包括分类、结构化数据提取、轻量级聊天应用以及大型语料库的预处理。

预览版将在两周内停止服务

此前使用gemini-3.1-flash-lite-preview的开发团队必须迁移至稳定标识符。Google表示预览版「将于2026年5月11日进入弃用阶段,并于2026年5月25日完全停止服务」。迁移操作实际上只需替换客户端配置中的一个字符串——预览版与GA版本的模型行为应保持一致。

在Gemini 3.1系列中的定位

Flash-Lite填补了Gemini 3.1系列价格阶梯的低端,位于标准Flash和Pro版本之下。GA状态意味着Google正式承担API合约和模型行为稳定性的SLA义务,这是将其纳入商业合同和受监管行业的前提条件。

对开发团队意味着什么?

一直等待GA版本才正式投入生产的团队现在获得了稳定的合约基础。已在使用预览版的团队距离该端点完全停止服务不足三周,必须尽快更新配置。

常见问题

模型的确切标识符是什么?
稳定端点标识符为「gemini-3.1-flash-lite」,通过Gemini API标准接口访问。
预览版何时停止服务?
预览端点「gemini-3.1-flash-lite-preview」将于2026年5月11日进入弃用阶段,并于2026年5月25日完全停止服务。
该模型适用于哪些场景?
Google将其定位为高流量应用的经济型生产选项,适用于速度和单位成本至关重要的场景。