术语表
术语表
AI 术语,简明定义。
73 术语
#
- 安全护栏 约束 AI 模型输入与输出的安全控制与过滤器——围绕模型部署的内容分类器、策略过滤器与攻击检测器。
- 测试时计算 在推理阶段投入更多算力——让模型在作答前进行更长时间的思考——以提升准确率,是现代推理模型的基础。
- 谄媚 (Sycophancy) AI 模型迎合并奉承用户的倾向:说用户想听的话,而非准确、有据的内容,常以牺牲真实性为代价。
- 大型语言模型 (LLM) 在海量文本语料上训练的深度神经网络,能够预测和生成人类语言;是 ChatGPT、Claude、Gemini 等现代 AI 助手的技术基础,几乎驱动着当今所有主流 AI 产品。
- 多模态模型 一种能在单个模型内处理和/或生成多种模态(文本、图像、音频、视频)的 AI 系统,而非局限于单一数据类型;它将不同模态映射到统一表示空间,由同一网络联合处理。
- 多智能体系统 一种 AI 架构,由多个专业化智能体协作、委托或竞争完成任务;通过角色分工、自我批评和并行化,比单一整体模型更可靠地解决庞大、多样或高风险的复杂问题。
- 分词 (Tokenization) 将文本拆分为较小单元(token)——完整单词、子词、字符或字节——并映射为整数 ID 的过程,是语言模型处理文本的第一步,直接影响成本和上下文窗口大小。
- 工具使用 大型语言模型调用外部工具、函数和 API 的能力,使其超越纯文本生成、在现实世界中采取实际行动,是构建 AI 智能体的核心基础能力。
- 函数调用 一种结构化机制:大型语言模型不再返回纯文本,而是输出对开发者所定义函数的调用及其参数,再由应用程序执行该函数并将结果返回模型。
- 合成数据 (Synthetic Data) 由模型或仿真人工生成的数据,用于在训练和评估 AI 模型时补充或替代人工采集的数据,可缓解数据稀缺并保护隐私。
- 红队 (Red Team) 由专业测试者用攻击方法对 AI 系统进行结构化测试——prompt injection、越狱、滥用场景、能力激发——以在生产部署前发现漏洞和不对齐行为,是前沿模型评测的标配。
- 幻觉(Hallucination) 语言模型生成听起来流畅且语气自信、但实际上在事实上存在错误、内容虚构或缺乏可靠来源支撑的输出;是当前大型语言模型(LLM)部署中最核心的质量风险之一。
- 混合专家模型 (MoE) 一种神经网络架构,通过学习型路由机制对每个输入仅激活少数专家子网络(MoE),从而在拥有超大参数规模与能力的同时,将推理计算成本控制在远低于等效密集模型的水平。
- 基础模型 (Foundation Model) 通过自监督学习在广泛数据上训练、可适配多种下游任务的大型模型;斯坦福 CRFM 于 2021 年提出的概念,涵盖大型语言模型、视觉模型和多模态模型等多种类型。
- 基于人类反馈的强化学习 (RLHF) 一种训练方法:人类评估者对模型多个响应进行排序,这些排序用于训练奖励模型,再通过强化学习(PPO)微调 LLM,使其变得更有帮助、更安全、更符合人类偏好。
- 基准测试 (Benchmark) 用于衡量并客观比较 AI 模型在各类任务上能力的标准化测试或数据集,例如 MMLU、GPQA、SWE-bench、HumanEval 和 MMMU 等。
- 检索增强生成 (RAG) 将检索系统与语言模型相结合的主流设计模式:在回答之前先从外部知识库(文档、网页、数据库)中检索相关内容并注入提示词,使模型输出建立在真实、可验证的数据基础之上。
- 开放权重 训练后权重可公开下载并运行的模型(Llama、Mistral、DeepSeek),但未公开训练数据与代码,因此不等同于完全开源。
- 可解释性 (interpretability) 一个研究领域,致力于理解 AI 模型的内部机制——特征与回路——从而解释模型为何产生特定输出,是 AI 安全的关键工具。
- 扩散模型 (Diffusion Model) 一类生成式模型,通过学习逆向逐步去除噪声来生成数据;当今 AI 图像、视频和音频生成领域的主导方法,是 Stable Diffusion 和 Sora 的基础。
- 量化 降低模型权重的数值精度(如从 FP16 降至 INT8 或 INT4),在几乎不损失准确度的前提下缩小体积并加速推理。
- 聊天机器人 (Chatbot) 通过文字或语音界面模拟与人类用户对话的软件系统;现代聊天机器人由大型语言模型和外部工具调用驱动,覆盖客户服务、企业知识库搜索、教育和编程辅助等众多场景。
- 模型上下文协议 (MCP) Anthropic 于 2024 年发布的开放协议,统一规范了 AI 助手连接外部工具与数据源的方式,使任何兼容的 AI 应用都能接入任何兼容的工具服务器,类似于 USB-C 对物理接口的标准化。
- 欧盟人工智能法案(EU AI Act) 欧盟根据风险等级(不可接受、高风险、有限风险、最低风险)对 AI 系统进行监管的法规,是全球首部综合性 AI 法律,自 2024 年起分阶段执行至 2027 年。
- 前沿模型 处于能力最前沿、规模最大且最强大的通用人工智能模型(GPT-5、Claude Opus、Gemini),是前沿安全与监管讨论的核心。
- 嵌入向量 (Embedding) 单词、句子、文档或图像在高维空间中的稠密向量表示,语义相近的内容在该空间中彼此靠近;是现代语义搜索、推荐系统和检索增强生成(RAG)不可或缺的核心基础构件。
- 强化学习 (Reinforcement Learning) 一种训练范式:智能体通过与环境交互、依据奖励信号进行试错来学习决策。它是 RLHF 和推理模型训练的基础。
- 上下文窗口 LLM 在一次交互中能够同时考虑的最大 token 数——包括系统提示词、上传文档、完整对话历史以及模型生成的回答;当今规模从 8K 一直到 200 万 token 不等。
- 上下文学习 (In-Context Learning) 上下文学习是指大语言模型仅凭提示词中给出的示例或说明即可学会执行新任务的能力,整个过程无需更新任何权重,而是依靠少样本或零样本示范在推理时直接完成,因此被视为一种涌现能力。
- 深度伪造 (Deepfake) 合成媒体——用深度学习生成的虚假人物视频、音频或图像;2025-2026 年虚假信息、诈骗与安全领域的核心隐患。
- 深度学习 机器学习的分支,使用多层神经网络学习复杂的层次化模式;驱动当今视觉、语音和语言 AI 系统,包括 GPT、Claude、Gemini 等大型语言模型背后的核心方法。
- 神经网络 由多层人工神经元构成、受人脑结构启发的计算模型,通过反向传播在数据上训练以学习复杂模式;是几乎所有现代机器学习(包括大型语言模型 LLM)的核心基础。
- 生成式预训练 Transformer (GPT) 一类仅解码器(decoder-only)Transformer 语言模型,在海量文本上预训练并经过指令微调;ChatGPT 及其同类产品背后的核心架构家族。
- 世界模型 AI 系统对环境动态学到的内部表征,用于预测未来状态并规划行动,无需在真实世界中反复试错。
- 视觉语言模型 在图像与文本上联合训练的 AI 模型,能「看懂」图像并用自然语言推理,是 GPT-4o、Claude 与 Gemini 视觉能力的基础。
- 数字水印 (Watermarking) 在 AI 生成的文本、图像或音频中嵌入隐藏的机器可读信号,以证明内容来源——例如谷歌的 SynthID。
- 思维链(Chain-of-Thought) 一种让语言模型在给出最终答案前先写出一系列中间推理步骤的技术,可显著提升模型在复杂多步任务上的准确率。
- 缩放定律 描述模型规模、训练数据与算力同性能之间幂律关系的经验规律,是规划大模型训练的基础。
- 提示词工程 (Prompt Engineering) 为语言模型设计提示词以可靠产出期望结果的实践;涵盖措辞、结构、上下文、格式说明、示例(few-shot)以及系统提示词等多个要素,并与安全性紧密相关。
- 提示词注入(Prompt Injection) 一种攻击方式:攻击者将恶意指令嵌入 LLM 的不可信输入中,使模型遵循攻击者的指令而非开发者的设计;位列 OWASP LLM 应用十大安全风险第一位。
- 通用人工智能 一种假想的人工智能,在几乎所有认知任务上达到或超越人类能力,与当今面向特定任务的狭义人工智能形成对比。
- 图形处理器 (GPU) 拥有数千个并行核心的图形处理器;如今训练和推理 AI 模型的主要硬件,市场由 NVIDIA H100/B200 主导,其 CUDA 生态构成软件护城河。
- 推测解码 一种推理加速技术:小型草稿模型一次性提出多个候选词元,由大模型并行验证接受,输出结果与标准解码完全一致。
- 推理 (Inference) 已训练好的模型针对新输入生成输出(如预测、分类或文本)的阶段;消耗 GPU/TPU 资源,决定 AI 服务的成本、延迟和吞吐量等核心商业指标,主导总体拥有成本。
- 推理模型(Reasoning Model) 经过专门训练的大型语言模型(LLM),在输出最终答案前会先生成详细的逐步思维链推理过程,以消耗更多推理时间为代价,在数学、编程与科学推断等复杂任务上取得更高准确率。
- 微调(Fine-tuning) 在较小规模的精选数据集上对已预训练语言模型进行继续训练的过程,使其在保留通用语言能力的前提下,更精准地适应特定任务、专业领域或特定输出风格与格式要求。
- 系统提示 在对话开始时设定、贯穿整个会话引导助手角色与行为的初始指令、人设与策略集合。它独立于用户消息之外,并被模型以更高的优先级加以处理。
- 宪法式 AI (Constitutional AI) Anthropic 提出的语言模型对齐方法:用一套书面原则(即「宪法」)加上 AI 自身的反馈(RLAIF)来引导和训练模型,而非依赖人类对有害输出的逐条标注。
- 向量数据库 一种专门的数据库,存储高维向量嵌入(embedding)并通过近似最近邻算法基于语义相似度进行检索;驱动语义搜索、推荐系统以及现代 RAG 系统的核心基础设施。
- 涌现能力 (Emergent Abilities) 小模型中不存在、却随规模扩大而突然出现的能力;这是一个有争议的论断——批评者认为这种突变源于非线性评测指标的选择。
- 越狱(Jailbreak) 一种对抗性提示词,旨在绕过大语言模型的安全护栏,通过角色扮演、假设情景等手法利用对齐弱点,迫使其生成经过训练本应拒绝输出的有害内容。它与提示词注入是两种不同的攻击类型。
- 知识蒸馏 (Knowledge Distillation) 一种模型压缩技术:较小的「学生」模型学习模仿较大「教师」模型的输出概率分布,从而在保持大部分精度的同时显著减小模型规模,便于在低资源设备和移动端进行推理。
- 智能体 AI 能够利用工具、记忆和循环机制,自主规划并执行多步骤复杂任务的 AI 系统范式,其能力远超单轮聊天问答;它可主动决策、调用工具、观察结果并持续行动,直至目标达成。
- 智能体编排 将多个 AI 智能体、工具和步骤协调为单一工作流——借助规划器、路由器及 LangGraph 等框架——以可靠地完成复杂任务。
- 重排序 检索的第二阶段,按相关性对召回的候选结果重新排序,通常用交叉编码器,以提升 RAG 与搜索的质量。
- 注意力机制 (attention) 神经网络技术,让模型为输入序列中每个 token 相对于其他 token 的重要性分配权重;是现代 Transformer 架构的核心机制,催生了今日的 LLM。
- 自监督学习 一种训练范式:模型从无标注数据中学习,通过自行构造监督信号——例如预测句子中被遮盖的 token 或下一个 token;几乎所有现代大型语言模型预训练的核心方法。
A
- A2A 协议(Agent2Agent) 谷歌于 2025 年推出的开放协议,用于实现不同框架、不同厂商所构建 AI 智能体之间的互操作与通信。
- AI 安全 (AI safety) 一个跨学科领域,覆盖 AI 系统在技术、组织和政策层面的全部风险——从当下的具体错误和滥用,到结构性社会影响,再到与未来高能力系统相关的长期生存性担忧。
- AI 对齐 (AI alignment) 一个研究领域,致力于构建 AI 系统使其目标和行为可靠地匹配人类的意图、价值和安全目标,而非走向奖励欺骗、规范取巧或欺骗性对齐等不期望甚至危险的结果。
- AI 加速器 (NPU/TPU) 面向 AI 工作负载设计的专用芯片——手机中的 NPU、Google 的 TPU、AWS Trainium——通常比 GPU 更快、单位成本效率更高。
- AI 评估 在模型发布前后,通过基准测试、人工评审和红队攻击,系统衡量 AI 模型能力、安全性与对齐程度的学科。
- AI 智能体 由大型语言模型(LLM)驱动的自主系统,能够规划行动步骤、调用各类外部工具(搜索、代码执行、API 等)、观察执行结果并反复迭代,直至完成复杂任务目标。
- AI Act 第 50 条(透明度) 欧盟 AI Act 第 50 条为聊天机器人、深度伪造与 AI 生成内容设立透明度义务,要求明确披露 AI 来源,确保用户始终知情;自 2026 年 8 月起适用。