🟢 🔧 ハードウェア 公開日: · 1 分で読めます ·

AMD:ROCm最適化でMatrix3DのInstinct GPU向け3D世界生成が最大54%高速化

編集用イラスト:手続き的に生成された3D景観がGPUコアから浮かび上がる様子

AMDはROCmブログにて、AMD Instinct GPU上で探索可能な3D世界を生成するフレームワーク「Matrix3D」の最適化を紹介しました。CUDAコンポーネントをTritonカーネルに置き換え、gsplatライブラリを使った3DGSを活用することで、MI250では54%、MI300では50%レンダリングが高速化し、レンダリングカーネル自体もCUDA版より36%速くなりました。

🤖

この記事はAIにより一次情報源から生成されました。

AMDROCmブログ にて、AMD Instinct GPU 上で探索可能な3D世界を生成するフレームワーク Matrix3D の最適化を紹介しました。ROCm は AMD の GPU コンピューティング向けソフトウェアスタックであり、NVIDIA の CUDA プラットフォームの直接競合にあたります。そのため、AI ワークロードを ROCm に移行することは、単一ベンダーへの依存を減らすうえで重要です。

変更された点

エンジニアは CUDA 専用コンポーネントTriton カーネル(移植可能な低レベル GPU コード)に置き換え、gsplat ライブラリを使った 3DGS(3D ガウシアンスプラッティング)を活用しました。3DGS は画像から3Dシーンを再構築する手法です。これにより、NVIDIA のクローズドエコシステムに依存せず、AMD ハードウェアに最適化された実装が実現しました。

数字で見る成果

MI250 GPU でのレンダリングは 54% 高速化(2887秒→1306秒)、MI300 では 50% 高速化(972秒→482秒)しました。Triton を使ったレンダリングカーネルは CUDA 版より 36% 速く、gsplat を使った 3DGS フィッティングのコストは 66% 削減されました。この技術は、空間 AI や具身型(embodied)AI アプリケーションの基盤として注目されており、3D 環境生成の需要はますます高まっています。

よくある質問

AMDは何を最適化しましたか?
AMD Instinct GPU上で探索可能な3D世界を生成するMatrix3Dフレームワークを最適化し、CUDAコンポーネントをTritonカーネルに置き換え、gsplatライブラリを活用しました。
どの程度高速化しましたか?
MI250 GPUで54%高速化(2887秒→1306秒)、MI300で50%高速化(972秒→482秒)、レンダリングカーネル自体はCUDA版より36%高速です。
3DGSフィッティングは何のためですか?
3DGS(3Dガウシアンスプラッティング)は画像から3Dシーンを再構築します。gsplatライブラリの使用によりコストが66%削減されました。