基础设施
基础模型 (Foundation Model)
通过自监督学习在广泛数据上训练、可适配多种下游任务的大型模型;斯坦福 CRFM 于 2021 年提出的概念,涵盖大型语言模型、视觉模型和多模态模型等多种类型。
基础模型(foundation model) 是斯坦福基础模型研究中心(CRFM)于 2021 年提出的术语,用于指称在广泛数据上通过自监督学习训练的大型模型,这些模型随后可通过微调或提示词被适配到一系列下游任务。
该定义有意比「大型语言模型」更宽。基础模型包括:
- 文本: GPT-5、Claude、Gemini、Llama
- 图像: Stable Diffusion、DALL-E、Midjourney
- 多模态: GPT-4o、Claude 3.5 Sonnet、Gemini 2.0(文本 + 图像 + 音频 + 视频)
- 代码: Codex、StarCoder、Qwen Coder
- 机器人与科学: RT-2、AlphaFold、MolecularAI
该术语存在争议——一些研究者认为它夸大了这些模型的通用性。尽管如此,它已进入监管法规:欧盟 AI 法案 明确规范了「通用型 AI 模型(general-purpose AI models)」,本质上是同义词,并对训练算力超过 10²⁵ FLOPs 的模型施加额外义务(系统性风险)。
CRFM 的核心论点是:基础模型同时承载 巨大的机会(一个底座支撑数百种应用)和 系统性风险(底座的每个缺陷都会向下游传播至基于它构建的每个产品)。围绕安全性、评测和红队测试的整个产业正是围绕这一论点兴起的。