🟡 📦 Open Source Objavljeno: · 2 min čitanja ·

PyTorch: verzija 2.12 donosi device-agnostic torch.accelerator.Graph, MX kvantizaciju i 100× brži linalg.eigh

Editorial illustration: PyTorch logo s grafom raspoređenim kroz CUDA i XPU akceleratore.

PyTorch 2.12 je nova produkcijska verzija PyTorch framework-a objavljena 13. svibnja 2026. s 2.926 commitova i 457 contributora. Glavni featurei: torch.accelerator.Graph device-agnostic API za CUDA, XPU i out-of-tree backends, torch.export podrška za Microscaling MX kvantizaciju (MXFP4/6/8), linalg.eigh do 100× brži na CUDA preko cuSolver, te torch.cond unutar CUDA Graphs. TorchScript je formalno uklonjen.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

PyTorch Foundation objavila je 13. svibnja 2026. verziju 2.12 framework-a — release sa 2.926 commitova i 457 contributora. Verzija donosi prijelaz na multi-vendor accelerator API, podršku za agresivnu kvantizaciju i značajna ubrzanja u linear algebra operacijama, uz formalno uklanjanje TorchScripta.

Kako torch.accelerator.Graph mijenja graph capture?

torch.accelerator.Graph je novi unificirani API za graph capture i replay koji radi kroz CUDA, XPU i out-of-tree backends. Zamjenjuje device-specific implementacije poput torch.xpu.XPUGraph. Backendovi se registriraju preko lightweight GraphImplInterface, a c10::Stream i torch.Stream dobivaju novu is_capturing() metodu za backend-agnostic stream checking. Implementaciju je donio Guangye Yu (Intel) kroz PR #171269 i #171285.

Što omogućuje MX kvantizacija u torch.export?

torch.export.save i torch.export.load sada podržavaju float8_e8m0fnu dtype. Promjena omogućuje full export agresivno kompresiranih modela u MXFP4, MXFP6 i MXFP8 formatima — kritično za deployment LLM-ova u cost-constrained i edge okruženjima. Doprinos je Chizkiyahu Raful (ARM) kroz PR #176270.

Koja ubrzanja donosi 2.12?

linalg.eigh je migrirao s legacy MAGMA backend-a na cuSolver i koristi syevj_batched unconditionally za batched operacije. PyTorch tim navodi do 100× ubrzanje na CUDA u tipičnim ML workloadovima — operacije koje su trajale minute sad rade u sekundama. Druga ključna optimizacija: torch.cond data-dependent control flow sada se može uhvatiti unutar CUDA Graphs preko CUDA 12.4 conditional IF nodes, što eliminira prethodni fallback na CUDA graph trees. Fused Adagrad optimizer se pridružuje Adamu, AdamW i SGD-u s fused=True podrškom.

Što znači uklanjanje TorchScripta?

TorchScript je deprecated od 2.10 i formalno uklonjen u 2.12. Preporučena zamjena: torch.export za model serijalizaciju i Executorch za embedded runtime. CUDA 12.8 wheel više se ne objavljuje u standard release matrix-u — PyTorch preporučuje CUDA 12.6 za starije arhitekture (Pascal, Volta) i CUDA 13.0+ za Blackwell.

Live Q&A event s panelistima Joe Spisak, Andrey Talman i Alban Desmaison zakazan je za srijedu 20. svibnja 2026. u 10 AM PST.

Česta pitanja

Što je torch.accelerator.Graph?
Unificirani API za graph capture i replay kroz CUDA, XPU i out-of-tree backends, zamjenjuje device-specific implementacije poput torch.xpu.XPUGraph; backendovi se registriraju preko lightweight GraphImplInterface, a c10::Stream dobiva is_capturing() metodu za backend-agnostic stream checking.
Što znači uklanjanje TorchScripta?
TorchScript je deprecated od verzije 2.10 i formalno uklonjen u 2.12; preporučena zamjena je torch.export za model serijalizaciju i Executorch za embedded runtime — postojeći production kod mora migrirati prije upgrade na 2.12+.