ONNX v1.22.0 中的注意力算子是什么？

这些是直接描述 Transformer 架构和大语言模型中注意力机制的原生算子，允许硬件运行时为长序列和流式应用实现专门的优化。

ONNX v1.22.0 如何改进供应链安全？

每个版本现在都包含 SLSA Level 2 关于代码来源的加密证明，以及列出所有依赖项、版本和许可证的内置软件物料清单（SBOM）。

ONNX 中的 WebAssembly 支持带来了什么？

借助与 Pyodide 的集成，ONNX 模型现在可以直接在浏览器中预览和验证，无需本地安装。

ONNX v1.22.0：面向生成式 AI 的注意力算子

LF AI & Data Foundation 发布 ONNX v1.22.0，带来面向 Transformer 架构和大语言模型的原生注意力算子、通过 Pyodide 在浏览器中预览模型的 WebAssembly 支持，以及 SLSA Level 2 加密证明。27 位贡献者参与其中，其中 16 位系首次贡献。

2026 年 6 月 30 日，LF AI & Data Foundation 发布了 ONNX v1.22.0——这一开放的 AI 模型交换标准的新版本，用于框架与硬件运行时之间的模型共享。本次发布带来三项关键更新：原生注意力算子支持、用于在浏览器中预览模型的 WebAssembly 集成，以及增强的供应链安全。

面向现代大语言模型的原生注意力算子

ONNX v1.22.0 最重要的技术变更是原生注意力算子——直接描述 Transformer 架构和大语言模型中所使用注意力机制的基础算子。此前，ONNX 模型中的注意力层以低级算子的组合形式表达——矩阵乘法、softmax 和 reshape 操作——这使硬件运行时难以实现专门的优化。

有了新算子，硬件提供商可以实现针对注意力机制定制的内核，直接提升长序列和流式应用的吞吐量。这对于拥有数十万 token 上下文窗口的大语言模型尤为重要，因为注意力计算在这些场景中主导了推理总成本。

为什么互操作性对生成式 AI 至关重要？

ONNX 的存在是为了让在一个框架中训练的模型能够在另一个框架中运行——无需重新训练或手动转换。PyTorch 模型变成 ONNX 表示，然后可以在 CPU（Intel OpenVINO）、GPU（NVIDIA TensorRT）、移动芯片（Qualcomm QNN）或专用加速器上的运行时中执行——无需修改模型。

在此版本之前，注意力层在 ONNX 中没有原生表示。这是现代大语言模型内部描述方式与 ONNX 模式可表达方式之间的结构性缺口。没有原生注意力算子，运行时就无法识别该模式并利用专门的硬件路径——它必须将注意力视为一系列通用操作处理。

ONNX v1.22.0 填补了这一缺口。现代 Transformer 架构现在成为 ONNX 生态系统的一等公民，这意味着 PyTorch、TensorFlow 和 scikit-learn 等框架可以在不丢失关键计算模式信息的情况下，以 ONNX 格式表达大语言模型。

WebAssembly 与供应链安全

v1.22.0 通过 Pyodide 集成引入了 WebAssembly 支持。ONNX 模型现在可以直接在浏览器中预览和验证，无需本地安装 Python 或 ONNX 库。模型图检查、形状推断验证和算子兼容性检查工具，对任何拥有 URL 的人都可用——无需搭建开发环境。

在安全方面，从本版本起，每个 ONNX 版本都携带 SLSA Level 2 关于代码来源的加密证明——关于制品构建位置和方式的可复现且经过验证的记录。此外，每个包现在都包含内置的 SBOM（软件物料清单），列出所有依赖项、版本和许可证。这是对开源 AI 工具供应链透明度日益增长的监管和商业要求的直接回应。

现代化的构建系统确保了在所有三个平台上的可复现构建：Linux、macOS 和 Windows。对于在 CI/CD 流水线中使用 ONNX 转换的团队，可复现构建意味着可预测的结果，不依赖于构建环境的状态。

社区、修复与路线图

ONNX v1.22.0 汇集了 27 位贡献者，其中 16 位系首次贡献。改进了框架在模型的 ONNX opset 版本之间转换时使用的形状推断辅助函数和版本转换器。除注意力算子外，还修正了几个关键算子在更广泛输入范围上的正确性，减少了边界情况下规范与实际行为之间的差异。

未来版本的路线图宣布了对概率和贝叶斯推断、扩展量化以及进一步改进形状推断的支持。

ONNX v1.22.0 可通过 GitHub 仓库 github.com/onnx/onnx 和标准包管理器获取。

ONNX v1.22.0 带来面向大语言模型的原生注意力算子和 WebAssembly 支持

面向现代大语言模型的原生注意力算子

为什么互操作性对生成式 AI 至关重要？

WebAssembly 与供应链安全

社区、修复与路线图

常见问题

来源

相关新闻