🟢 📦 开源 发布于: · 3 分钟阅读 ·

ONNX v1.22.0 带来面向大语言模型的原生注意力算子和 WebAssembly 支持

编辑配图:ONNX 1.22 版本带来新的注意力算子和 WebAssembly 互操作性

LF AI & Data Foundation 发布 ONNX v1.22.0,带来面向 Transformer 架构和大语言模型的原生注意力算子、通过 Pyodide 在浏览器中预览模型的 WebAssembly 支持,以及 SLSA Level 2 加密证明。27 位贡献者参与其中,其中 16 位系首次贡献。

🤖

本文由人工智能基于一手来源生成。

2026 年 6 月 30 日,LF AI & Data Foundation 发布了 ONNX v1.22.0——这一开放的 AI 模型交换标准的新版本,用于框架与硬件运行时之间的模型共享。本次发布带来三项关键更新:原生注意力算子支持、用于在浏览器中预览模型的 WebAssembly 集成,以及增强的供应链安全。

面向现代大语言模型的原生注意力算子

ONNX v1.22.0 最重要的技术变更是原生注意力算子——直接描述 Transformer 架构和大语言模型中所使用注意力机制的基础算子。此前,ONNX 模型中的注意力层以低级算子的组合形式表达——矩阵乘法、softmax 和 reshape 操作——这使硬件运行时难以实现专门的优化。

有了新算子,硬件提供商可以实现针对注意力机制定制的内核,直接提升长序列和流式应用的吞吐量。这对于拥有数十万 token 上下文窗口的大语言模型尤为重要,因为注意力计算在这些场景中主导了推理总成本。

为什么互操作性对生成式 AI 至关重要?

ONNX 的存在是为了让在一个框架中训练的模型能够在另一个框架中运行——无需重新训练或手动转换。PyTorch 模型变成 ONNX 表示,然后可以在 CPU(Intel OpenVINO)、GPU(NVIDIA TensorRT)、移动芯片(Qualcomm QNN)或专用加速器上的运行时中执行——无需修改模型。

在此版本之前,注意力层在 ONNX 中没有原生表示。这是现代大语言模型内部描述方式与 ONNX 模式可表达方式之间的结构性缺口。没有原生注意力算子,运行时就无法识别该模式并利用专门的硬件路径——它必须将注意力视为一系列通用操作处理。

ONNX v1.22.0 填补了这一缺口。现代 Transformer 架构现在成为 ONNX 生态系统的一等公民,这意味着 PyTorch、TensorFlow 和 scikit-learn 等框架可以在不丢失关键计算模式信息的情况下,以 ONNX 格式表达大语言模型。

WebAssembly 与供应链安全

v1.22.0 通过 Pyodide 集成引入了 WebAssembly 支持。ONNX 模型现在可以直接在浏览器中预览和验证,无需本地安装 Python 或 ONNX 库。模型图检查、形状推断验证和算子兼容性检查工具,对任何拥有 URL 的人都可用——无需搭建开发环境。

在安全方面,从本版本起,每个 ONNX 版本都携带 SLSA Level 2 关于代码来源的加密证明——关于制品构建位置和方式的可复现且经过验证的记录。此外,每个包现在都包含内置的 SBOM(软件物料清单),列出所有依赖项、版本和许可证。这是对开源 AI 工具供应链透明度日益增长的监管和商业要求的直接回应。

现代化的构建系统确保了在所有三个平台上的可复现构建:Linux、macOS 和 Windows。对于在 CI/CD 流水线中使用 ONNX 转换的团队,可复现构建意味着可预测的结果,不依赖于构建环境的状态。

社区、修复与路线图

ONNX v1.22.0 汇集了 27 位贡献者,其中 16 位系首次贡献。改进了框架在模型的 ONNX opset 版本之间转换时使用的形状推断辅助函数和版本转换器。除注意力算子外,还修正了几个关键算子在更广泛输入范围上的正确性,减少了边界情况下规范与实际行为之间的差异。

未来版本的路线图宣布了对概率和贝叶斯推断、扩展量化以及进一步改进形状推断的支持。

ONNX v1.22.0 可通过 GitHub 仓库 github.com/onnx/onnx 和标准包管理器获取。

常见问题

ONNX v1.22.0 中的注意力算子是什么?
这些是直接描述 Transformer 架构和大语言模型中注意力机制的原生算子,允许硬件运行时为长序列和流式应用实现专门的优化。
ONNX v1.22.0 如何改进供应链安全?
每个版本现在都包含 SLSA Level 2 关于代码来源的加密证明,以及列出所有依赖项、版本和许可证的内置软件物料清单(SBOM)。
ONNX 中的 WebAssembly 支持带来了什么?
借助与 Pyodide 的集成,ONNX 模型现在可以直接在浏览器中预览和验证,无需本地安装。