🔴 🔧 Hardware Veröffentlicht: · 3 Min. Lesezeit ·

OpenAI: Jalapeño — eigener ASIC-Chip für LLM-Inferenz, um die Abhängigkeit von NVIDIA zu reduzieren

Redaktionelle Illustration: futuristischer KI-Inferenzchip mit der Aufschrift Jalapeno auf einer Platine, grüne Akzentbeleuchtung, keine Gesichter oder Text

OpenAI und Broadcom haben gemeinsam Jalapeño angekündigt, einen maßgeschneiderten ASIC-Chip für LLM-Inferenz. Ein strategischer Schritt, mit dem OpenAI in die Kategorie eigener Siliziumlösungen eintritt — gleichrangig mit Google TPU, Apple Neural Engine und AWS Trainium — und die Abhängigkeit von NVIDIA-GPUs reduziert.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

OpenAI und Broadcom haben am 24. Juni 2026 Jalapeño angekündigt — einen Custom-ASIC-Chip (Application-Specific Integrated Circuit, ein Schaltkreis für genau eine Aufgabe), der für LLM-Inferenz optimiert ist, also für den Betrieb von Sprachmodellen in der Produktion und nicht für deren Training. Die Ankündigung markiert einen Wendepunkt: OpenAI hört auf, ausschließlich fremde Hardware zu kaufen, und beginnt, eigenen Silizium-Stack aufzubauen.

Warum ist Jalapeño ein strategischer Kurswechsel für OpenAI?

Bisher stützte OpenAI seine Infrastruktur fast ausschließlich auf NVIDIA-GPUs — teuer, weltweit nachgefragt und unter der Kontrolle eines einzigen Anbieters, dessen Lieferungen in den vergangenen Jahren aufgrund von die Kapazitäten übersteigender Nachfrage verzögert wurden. Jalapeño stellt OpenAI auf eine Stufe mit Google (TPU — Tensor Processing Unit), Amazon (AWS Trainium) und Apple (Neural Engine) als Unternehmen, die die Kontrolle über ihren eigenen Silizium-Stack übernommen haben. Jeder dieser Chips ist für einen spezifischen KI-Workload konzipiert und erzielt für diese enge Aufgabe ein besseres Leistungs-zu-Energieverbrauch-Verhältnis als universelle GPUs. Zum Vergleich: Google betreibt Gemini-Modelle mit TPUs zu Kosten pro Token, mit denen NVIDIA-H100-Cluster kaum mithalten können.

Leistung, Effizienz und Broadcoms Erfahrung

Das Projektziel ist dreifach: höhere Leistung für Inferenz-Aufgaben, bessere Energieeffizienz und leichtere Skalierbarkeit der Infrastruktur. Broadcom bringt langjährige Erfahrung im Custom-Silizium-Design und Kapazitäten in der Lieferkette ein — dasselbe Unternehmen ist an der Entwicklung von Googles TPUs und Metas MTIA-Chips beteiligt — was auf eine hohe Integration mit bestehender Rechenzentrumsinfrastruktur hindeutet.

Detaillierte technische Spezifikationen — Transistoranzahl, Speicherbandbreite, unterstützte numerische Präzisionen (FP8, BF16, INT8) — wurden in der ersten Ankündigung nicht veröffentlicht, was bei der frühen Offenbarung eines Chips vor dem Produktions-Deployment üblich ist. Vollständige Architektur und Benchmark-Ergebnisse werden in späteren Veröffentlichungen erwartet.

Das Rennen um Custom-Silizium — Google, Amazon, Microsoft, Tesla

Das Rennen um Custom-Silizium in der KI intensiviert sich. Google erzielte mit TPU v5e und v5p einen Kostenvorteil pro Token für Gemini. AWS Trainium 2 deckt Anthropics Trainings- und Inferenz-Bedarf ab. Microsoft setzt auf Maia 100 für Azure-KI-Workloads. Tesla verwendet Dojo für autonomes Fahren. Jalapeño gibt OpenAI einen analogen Hebel — die Fähigkeit, den gesamten Stack von der Modellarchitektur bis zum Silizium zu optimieren, auf dem er läuft, ohne von NVIDIAs Roadmap und Preispolitik abhängig zu sein.

Welche Auswirkungen hat das auf die Branche?

Falls OpenAI Jalapeño erfolgreich im großen Maßstab in der Produktion einsetzt, könnten die Inferenzkosten erheblich sinken — was sich auf die Preise der ChatGPT-API und die Kapazität für künftige, größere Modelle auswirken würde. Der Schritt erhöht zugleich den Druck auf NVIDIA: Während die Einnahmen aus KI-Chips im Geschäftsjahr 2025 über 100 Milliarden USD überstiegen, entwickeln immer mehr große Kunden eine Alternative. Jalapeño ist vorerst nur eine Ankündigung — aber ihr strategisches Gewicht übersteigt die technischen Details, die die Bekanntmachung noch nicht offenbart.

Häufig gestellte Fragen

Was ist der Jalapeño-Chip und wodurch unterscheidet er sich von NVIDIA-GPUs?
Jalapeño ist ein Custom-ASIC — ein Schaltkreis, der ausschließlich für LLM-Inferenz konzipiert ist, im Gegensatz zu NVIDIA-GPUs, die universelle Beschleuniger für verschiedene Aufgaben sind. Die spezialisierte Architektur ermöglicht bessere Energieeffizienz und höhere Leistung pro Watt für spezifische Sprachmodell-Workloads.
Warum entwickelt OpenAI einen eigenen Chip statt weiterhin NVIDIA-Hardware zu kaufen?
Die Abhängigkeit von einem einzigen Anbieter bringt Kosten- und Lieferbeschränkungen mit sich — besonders wenn GPUs branchenweit stark nachgefragt werden. Mit eigenem Silizium übernimmt OpenAI die Kontrolle über die Infrastruktur, senkt die Kosten pro Token und kann Hardware speziell für die eigenen Modelle optimieren.