🟢 🔧 하드웨어 게시일: · 1 분 읽기 ·

AMD:ROCm으로 Matrix3D 최적화, Instinct GPU에서 3D 세계 렌더링 최대 54% 가속

편집 일러스트: GPU 코어에서 절차적으로 생성된 3D 경관이 떠오르는 장면

AMD는 ROCm 블로그에서 AMD Instinct GPU 상의 탐색 가능한 3D 세계 생성 프레임워크 Matrix3D 최적화를 소개했습니다. CUDA 전용 컴포넌트를 Triton 커널로 교체하고 gsplat 라이브러리를 활용한 3DGS를 적용한 결과, MI250 GPU에서 54%, MI300에서 50% 렌더링이 가속되었으며 렌더링 커널 자체는 CUDA 버전보다 36% 빠릅니다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.

AMDROCm 블로그에서 AMD Instinct GPU 상에서 탐색 가능한 3D 세계를 생성하는 프레임워크 Matrix3D 최적화를 소개했습니다. ROCm은 AMD의 GPU 컴퓨팅용 소프트웨어 스택으로, NVIDIA의 CUDA 플랫폼의 직접적인 경쟁자입니다. AI 워크로드를 ROCm으로 이전하는 것은 단일 공급업체 의존성을 줄이는 데 중요합니다.

변경된 내용

엔지니어들은 CUDA 전용 컴포넌트Triton 커널—이식 가능한 저수준 GPU 코드—로 교체하고, gsplat 라이브러리를 활용한 3DGS(3D 가우시안 스플래팅)를 적용했습니다. 3DGS는 이미지에서 3D 장면을 재구성하는 기법입니다. 이로써 NVIDIA의 폐쇄 생태계에 의존하지 않고 AMD 하드웨어에 최적화된 구현이 실현되었습니다.

수치로 본 결과

MI250 GPU에서 렌더링 속도가 54% 향상(2887초→1306초)되었고, MI300에서는 50% 향상(972초→482초)되었습니다. Triton을 사용한 렌더링 커널은 CUDA 버전보다 36% 빠르며, gsplat를 활용한 3DGS 피팅 비용은 66% 절감되었습니다. 이 기술은 공간 AI 및 구현형(embodied) AI 애플리케이션의 기반으로 자리매김하고 있으며, 3D 환경 생성 수요가 점점 높아지고 있습니다.

자주 묻는 질문

AMD는 무엇을 최적화했습니까?
AMD Instinct GPU에서 탐색 가능한 3D 세계를 생성하는 Matrix3D 프레임워크를 최적화했으며, CUDA 전용 컴포넌트를 Triton 커널로 교체하고 gsplat 라이브러리를 활용했습니다.
속도 향상은 얼마나 됩니까?
MI250 GPU에서 54% 가속(2887초→1306초), MI300에서 50% 가속(972초→482초)되었으며 Triton 렌더링 커널은 CUDA 버전보다 36% 빠릅니다.
3DGS 피팅은 무엇에 쓰입니까?
3DGS(3D 가우시안 스플래팅)는 이미지에서 3D 장면을 재구성합니다. gsplat 라이브러리 사용으로 비용이 66% 절감되었습니다.