NVIDIA: Blackwell generira tokene 35 puta jeftinije od Hoppera — cijena po tokenu jedina je metrika
Zašto je bitno
NVIDIA je objavila analizu koja argumentira da je cijena po tokenu jedina relevantna metrika za AI infrastrukturu. Usporedba Blackwell i Hopper generacije pokazuje da Blackwell košta dva puta više po GPU satu, ali generira 65 puta više tokena u sekundi, rezultirajući 35 puta nižom cijenom po milijunu tokena — 0,12 dolara nasuprot 4,20 dolara za Hopper.
NVIDIA je objavila detaljnu analizu ukupnog troška vlasništva (TCO) za AI infrastrukturu, argumentirajući da industrija treba prestati uspoređivati cijene GPU-ova i umjesto toga gledati isključivo jednu metriku: cijenu po generiranom tokenu.
Kako Blackwell može biti 2x skuplji a 35x jeftiniji?
Paradoks je u propusnosti. Blackwell GPU košta otprilike dva puta više po satu korištenja od prethodne Hopper generacije. Međutim, Blackwell generira 65 puta više tokena u sekundi. Kad se izračuna cijena po milijunu generiranih tokena, Blackwell dolazi na 0,12 dolara nasuprot 4,20 dolara za Hopper — 35 puta jeftiniji.
NVIDIA koristi analogiju iz automobilske industrije: kamion koji troši duplo više goriva ali prevozi 65 puta više tereta je drastično efikasniji po kilogramu prevezene robe. Isto vrijedi za AI inference — apsolutna cijena GPU-a je irelevantna bez konteksta produktivnosti.
Što je “extreme codesign” pristup?
NVIDIA promovira koncept “extreme codesign” — istovremeno optimiziranje hardvera, softvera i mrežne infrastrukture kao jedinstven sustav. Umjesto da se GPU optimizira zasebno, a softver naknadno prilagodi, Blackwell platforma je dizajnirana kao integrirana cjelina gdje svaki sloj pojačava efikasnost ostalih.
Za organizacije koje grade ili unajmljuju AI infrastrukturu, poruka je jasna: usporedba specifikacija pojedinih komponenti daje iskrivljenu sliku. Jedina metrika koja utječe na poslovni rezultat je koliko košta generirati odgovor za krajnjeg korisnika — a ta cijena pada eksponencijalnim tempom s novim generacijama hardvera.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
Google na Cloud Next '26 predstavio TPU 8i i TPU 8t: specijalizirani čipovi za agentno AI računarstvo
Gemma 4 pokrenut kao Vision Language Agent lokalno na Jetson Orin Nano Super
NVIDIA i Google Cloud najavili suradnju za agentic AI i physical AI na zajedničkoj infrastrukturi