Um wie viel günstiger ist Blackwell pro Token im Vergleich zu Hopper?

Blackwell generiert Token für 0,12 Dollar pro Million, während Hopper 4,20 Dollar kostet — 35-mal teurer, obwohl Blackwell doppelt so hohe Kosten pro GPU-Stunde hat.

Warum sind die Kosten pro Token wichtiger als der Hardwarepreis?

Weil günstigere Hardware, die weniger Token pro Sekunde generiert, insgesamt teurer sein kann als teurere Hardware mit höherem Durchsatz — die Gesamtbetriebskosten hängen von der Produktivität ab, nicht vom Stückpreis.

NVIDIA: Blackwell generiert Token 35-mal günstiger als Hopper — Kosten pro Token sind die einzige Metrik

NVIDIA hat eine detaillierte Gesamtbetriebskosten-Analyse (TCO) für KI-Infrastruktur veröffentlicht und argumentiert, dass die Branche aufhören sollte, GPU-Preise zu vergleichen, und sich stattdessen ausschließlich auf eine Metrik konzentrieren sollte: die Kosten pro generiertem Token.

Wie kann Blackwell 2-mal teurer und dennoch 35-mal günstiger sein?

Das Paradoxon liegt im Durchsatz. Eine Blackwell-GPU kostet pro Nutzungsstunde etwa doppelt so viel wie die vorherige Hopper-Generation. Blackwell generiert jedoch 65-mal mehr Token pro Sekunde. Wenn die Kosten pro Million generierter Token berechnet werden, kommt Blackwell auf 0,12 Dollar gegenüber 4,20 Dollar für Hopper — 35-mal günstiger.

NVIDIA verwendet eine Analogie aus der Transportbranche: Ein LKW, der doppelt so viel Kraftstoff verbraucht, aber 65-mal mehr Fracht befördert, ist pro Kilogramm transportierter Ware dramatisch effizienter. Dasselbe gilt für KI-Inferenz — der absolute Preis einer GPU ist ohne den Kontext der Produktivität irrelevant.

Was ist der „Extreme Codesign”-Ansatz?

NVIDIA fördert das Konzept des „Extreme Codesign” — die gleichzeitige Optimierung von Hardware, Software und Netzwerkinfrastruktur als einheitliches System. Anstatt die GPU isoliert zu optimieren und die Software nachträglich anzupassen, ist die Blackwell-Plattform als integriertes Ganzes konzipiert, bei dem jede Schicht die Effizienz der anderen verstärkt.

Für Organisationen, die KI-Infrastruktur aufbauen oder mieten, ist die Botschaft klar: Der Vergleich einzelner Komponentenspezifikationen liefert ein verzerrtes Bild. Die einzige Metrik, die das Geschäftsergebnis beeinflusst, sind die Kosten für die Generierung einer Antwort für einen Endnutzer — und diese Kosten sinken mit jeder neuen Hardwaregeneration exponentiell.

NVIDIA: Blackwell generiert Token 35-mal günstiger als Hopper — Kosten pro Token sind die einzige Metrik

Wie kann Blackwell 2-mal teurer und dennoch 35-mal günstiger sein?

Was ist der „Extreme Codesign”-Ansatz?

Quellen

Verwandte Nachrichten