OpenAI: Jalapeño — vlastiti ASIC čip za LLM inference koji smanjuje ovisnost o NVIDIA-i
OpenAI i Broadcom zajednički su najavili Jalapeño, custom ASIC čip optimiziran za LLM inference. Strateški korak kojim OpenAI ulazi u kategoriju vlastitog silikona — ravnopravno uz Google TPU, Apple Neural Engine i AWS Trainium — i smanjuje ovisnost o NVIDIA GPU-ima.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
OpenAI i Broadcom najavili su 24. lipnja 2026. Jalapeño — custom ASIC čip (Application-Specific Integrated Circuit, integrirani sklop namijenjen isključivo jednoj vrsti zadataka) optimiziran za LLM inference, tj. za pokretanje jezičnih modela u produkciji, a ne za njihovo treniranje. Najava označava prekretnicu: OpenAI prestaje biti isključivo kupac tuđeg hardvera i kreće graditi vlastiti silikon-stog.
Zašto je Jalapeño strateški preokret za OpenAI?
Dosad je OpenAI svoju infrastrukturu temeljio gotovo isključivo na NVIDIA GPU-ima — skupim, globalno traženim i pod kontrolom jednog dobavljača čije su isporuke u proteklim godinama kasnile zbog potražnje koja premašuje kapacitete. Jalapeño OpenAI svrstava uz bok Googleu (TPU — Tensor Processing Unit), Amazonu (AWS Trainium) i Appleu (Neural Engine) kao kompanije koje su preuzele kontrolu nad vlastitim silikon-stackom. Svaki od tih čipova projektiran je za specifičnu AI radnu opterećenost i postiže bolji omjer performansi i potrošnje energije od generalnih GPU-a za taj uski zadatak. Za usporedbu: Google s TPU-ima pokreće Gemini modele uz trošak po tokenu koji NVIDIA H100 klasteri teško mogu parirati.
Performanse, efikasnost i Broadcomovo iskustvo
Cilj projekta trostruk je: više performansi za inference zadatke, veća energetska efikasnost i lakša skalabilnost infrastrukture. Broadcom donosi dugogodišnje iskustvo u custom silikon dizajnu i kapacitete u opskrbnom lancu — ista kompanija sudjeluje u razvoju Googleovih TPU-a i Meta-inih MTIA čipova — što upućuje na visoku razinu integracije s postojećom datacenter infrastrukturom.
Detaljne tehničke specifikacije — broj tranzistora, propusnost memorije, podržane numeričke preciznosti (FP8, BF16, INT8) — nisu objavljene u prvoj najavi, što je uobičajen pristup pri ranom otkrivanju čipa prije produkcijskog deployja. Puna arhitektura i benchmark rezultati očekuju se u kasnijim objavama.
Utrka za custom silikon — Google, Amazon, Microsoft, Tesla
Utrka za custom silikon u AI-u intenzivira se. Google je s TPU v5e i v5p ostvario cost-per-token prednost za Gemini. AWS Trainium 2 pokriva Anthropicove potrebe za treniranjem i inferenceom. Microsoft se oslanja na Maia 100 za Azure AI workloade. Tesla koristi Dojo za autonomnu vožnju. Jalapeño OpenAI-u daje analognu polugu — sposobnost da optimizira cijeli stog od arhitekture modela do silikona na kojemu se pokreće, bez ovisnosti o NVIDIA roadmapi i cjenovnoj politici.
Koje su implikacije za industriju?
Ako OpenAI uspješno masovno produkcijski deploja Jalapeño, troškovi inference-a mogli bi se znatno smanjiti — što bi se odrazilo na cijene ChatGPT API-ja i kapacitet za buduće, veće modele. Potez ujedno pojačava pritisak na NVIDIA: dok je prihod od AI čipova u fiskalnoj godini 2025. premašio 100 milijardi USD, sve više velikih kupaca razvija alternativu. Jalapeño je zasad tek najava — ali njezina strateška težina premašuje tehničke detalje koje objava još ne otkriva.
Česta pitanja
- Što je Jalapeño čip i po čemu se razlikuje od NVIDIA GPU-a?
- Jalapeño je custom ASIC — integrirani sklop projektiran isključivo za LLM inference, za razliku od NVIDIA GPU-a koji su opći akceleratori za razne zadatke. Specijalizirana arhitektura omogućuje bolju energetsku efikasnost i veće performanse po watu za specifično opterećenje jezičnih modela.
- Zašto OpenAI razvija vlastiti čip umjesto nastavka kupnje NVIDIA hardvera?
- Ovisnost o jednom dobavljaču donosi troškovna i opskrbna ograničenja — posebno kada su GPU-i traženi diljem industrije. Vlastitim silikon OpenAI preuzima kontrolu nad infrastrukturom, smanjuje trošak po tokenu i može optimizirati hardver specifično za vlastite modele.