AMD ROCm：Matrix3D 3D世界生成が最大54%高速化

AMDはROCmブログにて、AMD Instinct GPU上で探索可能な3D世界を生成するフレームワーク「Matrix3D」の最適化を紹介しました。CUDAコンポーネントをTritonカーネルに置き換え、gsplatライブラリを使った3DGSを活用することで、MI250では54%、MI300では50%レンダリングが高速化し、レンダリングカーネル自体もCUDA版より36%速くなりました。

AMD は ROCmブログ にて、AMD Instinct GPU 上で探索可能な3D世界を生成するフレームワーク Matrix3D の最適化を紹介しました。ROCm は AMD の GPU コンピューティング向けソフトウェアスタックであり、NVIDIA の CUDA プラットフォームの直接競合にあたります。そのため、AI ワークロードを ROCm に移行することは、単一ベンダーへの依存を減らすうえで重要です。

変更された点

エンジニアは CUDA 専用コンポーネントを Triton カーネル（移植可能な低レベル GPU コード）に置き換え、gsplat ライブラリを使った 3DGS（3D ガウシアンスプラッティング）を活用しました。3DGS は画像から3Dシーンを再構築する手法です。これにより、NVIDIA のクローズドエコシステムに依存せず、AMD ハードウェアに最適化された実装が実現しました。

数字で見る成果

MI250 GPU でのレンダリングは 54% 高速化（2887秒→1306秒）、MI300 では 50% 高速化（972秒→482秒）しました。Triton を使ったレンダリングカーネルは CUDA 版より 36% 速く、gsplat を使った 3DGS フィッティングのコストは 66% 削減されました。この技術は、空間 AI や具身型（embodied）AI アプリケーションの基盤として注目されており、3D 環境生成の需要はますます高まっています。

よくある質問

AMDは何を最適化しましたか？

AMD Instinct GPU上で探索可能な3D世界を生成するMatrix3Dフレームワークを最適化し、CUDAコンポーネントをTritonカーネルに置き換え、gsplatライブラリを活用しました。

どの程度高速化しましたか？

MI250 GPUで54%高速化（2887秒→1306秒）、MI300で50%高速化（972秒→482秒）、レンダリングカーネル自体はCUDA版より36%高速です。

3DGSフィッティングは何のためですか？

3DGS（3Dガウシアンスプラッティング）は画像から3Dシーンを再構築します。gsplatライブラリの使用によりコストが66%削減されました。

AMD：ROCm最適化でMatrix3DのInstinct GPU向け3D世界生成が最大54%高速化

変更された点

数字で見る成果

よくある質問

出典

関連ニュース