模型

Google Gemini

Google DeepMind 推出的多模态基础模型家族,可处理文本、图像、音频和视频;驱动 Gemini 应用、Workspace 和 Vertex AI。

Google Gemini 是由 Google DeepMind 构建的多模态基础模型家族,于 2023 年 12 月发布,作为早期 PaLM 和 LaMDA 系列的继任者。Gemini 从一开始就被设计为原生多模态:在单个大型语言模型内统一处理文本、图像、音频、视频和代码,而不是事后将各种模态「拼接」到一个文本模型上。

该产品线分为多个层级:Gemini Nano 在设备端运行,Flash 面向高吞吐云端推理,Pro 是日常工作主力,而 Ultra/Advanced 则与 GPT 和 Claude 一同位于前沿。后续版本——Gemini 1.5、2.0、2.5——将上下文扩展到一百万 token 甚至更多,添加了原生工具调用,并成熟为能够操控浏览器和代码库的 AI 智能体

Gemini 为同名消费者应用、Google Workspace(Docs、Gmail、Sheets、Meet)中的 AI 功能、Android 助手以及面向开发者的 Vertex AI 平台提供动力。Google 还提供 Gemma——与 Gemini 共享架构理念但面向开源社区的 open-weight 衍生模型。

来源

另见