基础设施

基础模型 (Foundation Model)

通过自监督学习在广泛数据上训练、可适配多种下游任务的大型模型;斯坦福 CRFM 于 2021 年提出的概念,涵盖大型语言模型、视觉模型和多模态模型等多种类型。

基础模型(foundation model 是斯坦福基础模型研究中心(CRFM)于 2021 年提出的术语,用于指称在广泛数据上通过自监督学习训练的大型模型,这些模型随后可通过微调或提示词被适配到一系列下游任务。

该定义有意比「大型语言模型」更宽。基础模型包括:

  • 文本: GPT-5、Claude、Gemini、Llama
  • 图像: Stable Diffusion、DALL-E、Midjourney
  • 多模态: GPT-4o、Claude 3.5 Sonnet、Gemini 2.0(文本 + 图像 + 音频 + 视频)
  • 代码: Codex、StarCoder、Qwen Coder
  • 机器人与科学: RT-2、AlphaFold、MolecularAI

该术语存在争议——一些研究者认为它夸大了这些模型的通用性。尽管如此,它已进入监管法规:欧盟 AI 法案 明确规范了「通用型 AI 模型(general-purpose AI models)」,本质上是同义词,并对训练算力超过 10²⁵ FLOPs 的模型施加额外义务(系统性风险)。

CRFM 的核心论点是:基础模型同时承载 巨大的机会(一个底座支撑数百种应用)和 系统性风险(底座的每个缺陷都会向下游传播至基于它构建的每个产品)。围绕安全性、评测和红队测试的整个产业正是围绕这一论点兴起的。

来源

另见