🟢 📦 オープンソース 公開日: · 4 分で読めます ·

ONNX v1.22.0:LLM向けネイティブAttentionオペレーターとWebAssemblyサポートを搭載

エディトリアルイラスト:ONNX v1.22が新しいAttentionオペレーターとWebAssembly相互運用性を導入

LF AI & Data FoundationはトランスフォーマーアーキテクチャとLLM向けネイティブAttentionオペレーター、ブラウザでのモデル検査のためのWebAssemblyサポート、SLSA Level 2暗号化証明を搭載したONNX v1.22.0を公開した。27名のコントリビューターが参加し、そのうち16名が初参加だ。

🤖

この記事はAIにより一次情報源から生成されました。

LF AI & Data Foundationは2026年6月30日にONNX v1.22.0を公開した。フレームワークとハードウェアランタイム間でAIモデルを交換するためのオープン標準の新バージョンだ。このリリースは三つの主要な新機能をもたらす:Attentionオペレーターのネイティブサポート、ブラウザでのモデル検査のためのWebAssembly統合、サプライチェーンセキュリティの強化だ。

最新LLM向けネイティブAttentionオペレーター

ONNX v1.22.0における最も重要な技術的変更は、ネイティブAttentionオペレーター——トランスフォーマーアーキテクチャとLLMで使用されるAttentionメカニズムを直接記述するプリミティブオペレーター——だ。これまでONNXモデルのAttentionレイヤーは低レベルオペレーターの合成——行列乗算、Softmax、Reshapeオペレーション——として表現されており、ハードウェアランタイムが特化した最適化を実装することが困難だった。

新しいオペレーターにより、ハードウェアプロバイダーはAttentionメカニズムに合わせたカーネルを実装でき、長いシーケンスとストリーミングアプリケーションのスループットを直接向上させる。これはコンテキストウィンドウが数十万トークンに達するLLMにとって特に重要で、そこではAttention計算が推論コスト全体を支配する。

なぜ生成AIにおいて相互運用性が重要なのか?

ONNXはあるフレームワークでトレーニングされたモデルを、再トレーニングや手動変換なしに別のフレームワークで実行できるようにするために存在する。PyTorchモデルはONNX表現になり、CPU(Intel OpenVINO)、GPU(NVIDIA TensorRT)、モバイルチップ(Qualcomm QNN)、または特化したアクセラレーターのランタイムがモデルの変更なしに実行できる。

このバージョンまで、Attentionレイヤーはモデル内でのネイティブ表現を持たなかった。これはモダンLLMが内部でどのように記述されるかとONNXスキーマで表現できる方法の間の構造的なギャップだった。ネイティブAttentionオペレーターなしでは、ランタイムはパターンを認識できず特化したハードウェアパスを活用できなかった——Attentionを一連の汎用オペレーションとして処理せざるを得なかった。

ONNX v1.22.0はそのギャップを埋める。最新のトランスフォーマーアーキテクチャはONNXエコシステムの完全な市民となり、PyTorch、TensorFlow、scikit-learnなどのフレームワークが主要な計算パターンの情報を失うことなくONNX形式でLLMを表現できるようになる。

WebAssemblyとサプライチェーンセキュリティ

バージョン1.22.0はPyodide統合によるWebAssemblyサポートを導入する。ONNXモデルはPythonやONNXライブラリのローカルインストールなしに、ブラウザ内で直接検査と検証が可能になった。モデルグラフの検査、形状推論の検証、オペレーター互換性チェックのツールが、開発環境のセットアップなしにURLを持つ誰でも利用できる。

セキュリティ面では、このバージョンからすべてのONNXリリースがコードの出所に関するSLSA Level 2暗号化証明を持つ——アーティファクトがどこでどのように構築されたかの再現可能で検証可能な証拠だ。さらに、各パッケージにはすべての依存関係、バージョン、ライセンスを列挙した組み込みのSBOM(ソフトウェア部品表)が含まれる。これはオープンソースAIツールにおけるサプライチェーンの透明性に対する高まる規制上・ビジネス上の要求への直接的な対応だ。

最新化されたビルドシステムはすべての三つのプラットフォームで再現可能なビルドを保証する:Linux、macOS、Windows。ONNX変換でCI/CDパイプラインを自動化するチームにとって、ビルドの再現性はビルド環境の状態に依存することなく予測可能な結果を意味する。

コミュニティ、バグ修正、ロードマップ

ONNX v1.22.0は27名のコントリビューターを結集し、そのうち16名は初めての参加だ。フレームワークがONNX opsetバージョン間でモデルを変換する際に使用する形状推論ヘルパー関数とバージョンコンバーターが改善された。Attentionオペレーターに加え、より広い範囲の入力に対する主要オペレーターの正確性が修正され、エッジケースでの仕様と実際の動作の乖離が減少した。

将来のバージョンのロードマップには確率的およびベイズ推論のサポート、拡張量子化、形状推論のさらなる改善が予告されている。

ONNX v1.22.0はGitHubリポジトリ github.com/onnx/onnx と標準的なパッケージマネージャーから利用可能だ。

よくある質問

ONNX v1.22.0のAttentionオペレーターとは何か?
トランスフォーマーアーキテクチャとLLMで使用されるAttentionメカニズムを直接記述するネイティブオペレーターで、ハードウェアランタイムが長いシーケンスとストリーミングアプリケーション向けに特化した最適化を実装できるようにする。
ONNX v1.22.0はサプライチェーンセキュリティをどのように向上させるか?
各リリースにはコードの出所に関するSLSA Level 2暗号化証明と、すべての依存関係、バージョン、ライセンスを列挙した組み込みのソフトウェア部品表(SBOM)が含まれるようになった。
ONNX v1.22.0のWebAssemblyサポートは何をもたらすか?
Pyodideとの統合により、ローカルインストールなしにブラウザ内でONNXモデルの検査と検証が直接できるようになった。