🟡 📦 オープンソース 公開日: · 2 分で読めます ·

PyTorch: ExecuTorch が Arm Cortex-A・Cortex-M・Ethos-U85 NPU でエッジ AI 推論に対応

エディトリアルイラスト:Arm チップとニューラルネットワーク図形を持つエッジデバイス。

ExecuTorch on Arm は 2026 年 5 月 12 日に発表された PyTorch Foundation の新しいイニシアティブで、ExecuTorch ランタイムを Arm Cortex-A・Cortex-M CPU および Ethos-U NPU アクセラレーターに拡張します。OPT-125M トランスフォーマーと MobileNetV2 モデルが Raspberry Pi 5 と 256 MAC ユニットを持つ Ethos-U85 で動作し、Arm Education リポジトリはエッジ AI デプロイメントの実践ラボを提供します。

🤖

この記事はAIにより一次情報源から生成されました。

PyTorch Foundation は 2026 年 5 月 12 日に ExecuTorch ランタイムを Arm Cortex-A、Cortex-M、Ethos-U NPU プラットフォームに公式拡張することを発表しました。このイニシアティブはリソースが限られたエッジデバイス——ウェアラブル、スマートカメラ、IoT システム——に効率的な PyTorch 推論をもたらし、PyTorch 開発者体験を維持します。

ExecuTorch が対応した Arm ハードウェアは何ですか?

CPU 側は Raspberry Pi 5 などの Cortex-A プラットフォームと Cortex-M マイクロコントローラーをカバーしています。ExecuTorch は XNNPACK バックエンドを通じて KleidiAI マイクロカーネルと Neon アーキテクチャ機能を使用し、PyTorch eager モードと比較してレイテンシを大幅に削減します。PyTorch のドキュメントは警告しています:XNNPACK デリゲーションなしでは、ランタイムフットプリントが小さくても eager モードよりもレイテンシが高くなる場合があります。

NPU 側は通常 Cortex-A または Cortex-M CPU と組み合わせる Ethos-U アクセラレーターを対象としています。ハードウェアの例は 256 MAC(乗算累算)ユニットを持つ Ethos-U85 で、ExecuTorch はこれを主要なデプロイメントターゲットとして扱います。

チュートリアルではどのモデルを扱っていますか?

ドキュメントは 3 つのシナリオを実演しています。OPT-125M トランスフォーマーモデルを XNNPACK CPU バックエンドで Raspberry Pi 5 で実行。MobileNetV2 INT8 モデルを EthosUQuantizer と EthosUCompileSpec API を通じて Ethos-U NPU にデプロイ。MobileNetV2 + LRN のケースでは、ランタイムがサポートされていない演算子を処理する方法を示しています。

Arm Education リポジトリで開発者が得られるものは何ですか?

GitHub リポジトリ arm-education/executorch_on_arm_labs には実践ラボが含まれています:Raspberry Pi 5 での CPU 推論、Ethos-U NPU を使ったハードウェアアクセラレーション推論、そして .pte ファイル・バックエンドパーティショニング・TOSA 表現・Arm ML SDK Vulkan 用 VGF ファイルの可視化のための Model Explorer アダプター(Arm が開発)。ラボコンテンツは Marcelo Rovai(UNIFEI 大学、Edge AI Foundation)と IIIT バンガロールの学術審査者が作成しました。

エッジ AI エコシステムにおける位置づけ

デプロイメントパイプラインは PyTorch モデルを量子化、TOSA(テンソル演算子セットアーキテクチャ)表現、Vela 最適化を経て .pte アーティファクトに変換します。静的な計算グラフは制約のあるシステムでの予測可能な実行を保証します。ExecuTorch は PyTorch エコシステムをエッジ推論分野の本格的なプレイヤーとして位置づけます——これまでは TensorFlow Lite Micro と ONNX Runtime が主導していた分野です。

よくある質問

Arm ハードウェアで ExecuTorch を通じて実行できるモデルは何ですか?
ドキュメントでは Raspberry Pi 5(Cortex-A)での OPT-125M トランスフォーマーモデルと、Ethos-U NPU での量子化 MobileNetV2(INT8)モデルを実演しています。すべてのモデルは PyTorch 互換で軽量な .pte(PyTorch Export)形式でエクスポート可能である必要があります。
XNNPACK バックエンドデリゲーションは何を提供しますか?
XNNPACK バックエンドは KleidiAI マイクロカーネルと Neon アーキテクチャ機能を使用し、Cortex-A CPU でのレイテンシを大幅に削減します。XNNPACK デリゲーションなしでは ExecuTorch はランタイムフットプリントが小さくても PyTorch eager モードよりもレイテンシが高くなる場合があります。