AMD:ROCm最適化でMatrix3DのInstinct GPU向け3D世界生成が最大54%高速化
AMDはROCmブログにて、AMD Instinct GPU上で探索可能な3D世界を生成するフレームワーク「Matrix3D」の最適化を紹介しました。CUDAコンポーネントをTritonカーネルに置き換え、gsplatライブラリを使った3DGSを活用することで、MI250では54%、MI300では50%レンダリングが高速化し、レンダリングカーネル自体もCUDA版より36%速くなりました。
この記事はAIにより一次情報源から生成されました。
AMD は ROCmブログ にて、AMD Instinct GPU 上で探索可能な3D世界を生成するフレームワーク Matrix3D の最適化を紹介しました。ROCm は AMD の GPU コンピューティング向けソフトウェアスタックであり、NVIDIA の CUDA プラットフォームの直接競合にあたります。そのため、AI ワークロードを ROCm に移行することは、単一ベンダーへの依存を減らすうえで重要です。
変更された点
エンジニアは CUDA 専用コンポーネントを Triton カーネル(移植可能な低レベル GPU コード)に置き換え、gsplat ライブラリを使った 3DGS(3D ガウシアンスプラッティング)を活用しました。3DGS は画像から3Dシーンを再構築する手法です。これにより、NVIDIA のクローズドエコシステムに依存せず、AMD ハードウェアに最適化された実装が実現しました。
数字で見る成果
MI250 GPU でのレンダリングは 54% 高速化(2887秒→1306秒)、MI300 では 50% 高速化(972秒→482秒)しました。Triton を使ったレンダリングカーネルは CUDA 版より 36% 速く、gsplat を使った 3DGS フィッティングのコストは 66% 削減されました。この技術は、空間 AI や具身型(embodied)AI アプリケーションの基盤として注目されており、3D 環境生成の需要はますます高まっています。
よくある質問
- AMDは何を最適化しましたか?
- AMD Instinct GPU上で探索可能な3D世界を生成するMatrix3Dフレームワークを最適化し、CUDAコンポーネントをTritonカーネルに置き換え、gsplatライブラリを活用しました。
- どの程度高速化しましたか?
- MI250 GPUで54%高速化(2887秒→1306秒)、MI300で50%高速化(972秒→482秒)、レンダリングカーネル自体はCUDA版より36%高速です。
- 3DGSフィッティングは何のためですか?
- 3DGS(3Dガウシアンスプラッティング)は画像から3Dシーンを再構築します。gsplatライブラリの使用によりコストが66%削減されました。