Hardver

TPU (Tensor Processing Unit)

TPU je Googleov namjenski ASIC čip za ubrzavanje strojnog učenja, optimiziran za matrične operacije pri treniranju i izvođenju neuronskih mreža.

TPU (Tensor Processing Unit) je namjenski integrirani sklop (ASIC) koji je Google razvio posebno za ubrzavanje radnih opterećenja strojnog učenja. Za razliku od opće namjenskog GPU-a, TPU je projektiran isključivo za masovne matrične operacije koje čine srž rada neuronskih mreža.

Arhitektura se temelji na sistoličkom polju (systolic array) procesnih elemenata koji obavljaju množenje matrica uz niske preciznosti (primjerice 8-bitno ili FP4/BF16), čime se postiže visoka propusnost i energetska učinkovitost. Google interno koristi TPU-ove od 2015., a od 2018. dostupni su i vanjskim korisnicima putem Google Clouda. Čipove suproizvodi Broadcom, a izrađuje TSMC.

TPU-ovi su ključni dio Googleove AI infrastrukture: pogone treniranje i izvođenje modela poput Gemini obitelji. Novije generacije — Trillium (v6), Ironwood (v7) te najavljene varijante za 2026. — donose razdvojene arhitekture za treniranje i izvođenje, čime TPU ostaje glavni Googleov odgovor na dominaciju Nvidijinih GPU-ova u dubokom učenju.

Izvori

Vidi također