Google Gemini

Google Gemini 是由 Google DeepMind 构建的多模态基础模型家族，于 2023 年 12 月发布，作为早期 PaLM 和 LaMDA 系列的继任者。Gemini 从一开始就被设计为原生多模态：在单个大型语言模型内统一处理文本、图像、音频、视频和代码，而不是事后将各种模态「拼接」到一个文本模型上。

该产品线分为多个层级：Gemini Nano 在设备端运行，Flash 面向高吞吐云端推理，Pro 是日常工作主力，而 Ultra/Advanced 则与 GPT 和 Claude 一同位于前沿。后续版本——Gemini 1.5、2.0、2.5——将上下文扩展到一百万 token 甚至更多，添加了原生工具调用，并成熟为能够操控浏览器和代码库的 AI 智能体。

Gemini 为同名消费者应用、Google Workspace（Docs、Gmail、Sheets、Meet）中的 AI 功能、Android 助手以及面向开发者的 Vertex AI 平台提供动力。Google 还提供 Gemma——与 Gemini 共享架构理念但面向开源社区的 open-weight 衍生模型。

来源

另见