OpenAI:Jalapeño — 减少对NVIDIA依赖的自研LLM推理ASIC芯片
OpenAI与博通联合宣布Jalapeño——专为LLM推理优化的定制ASIC芯片。这是OpenAI进入自研芯片领域的战略举措,与谷歌TPU、苹果神经引擎和AWS Trainium并列,同时减少对NVIDIA GPU的依赖。
本文由人工智能基于一手来源生成。
OpenAI与博通于2026年6月24日宣布Jalapeño——一款专为LLM推理优化的定制ASIC芯片(专用集成电路,专为单一类型任务设计),即在生产环境中运行语言模型,而非训练。这一宣告标志着转折点:OpenAI不再仅仅是他人硬件的买家,开始打造自己的芯片栈。
Jalapeño为何是OpenAI的战略转型?
此前OpenAI的基础设施几乎完全依赖NVIDIA GPU——价格昂贵、全球需求旺盛,且受制于单一供应商,近年来因需求超过产能而导致交货延迟。Jalapeño使OpenAI与谷歌(TPU——张量处理单元)、亚马逊(AWS Trainium)和苹果(神经引擎)并列,成为掌控自己芯片栈的公司。每款芯片都针对特定AI工作负载设计,在该细分任务上实现比通用GPU更好的性能能效比。对比而言:谷歌通过TPU运行Gemini模型,每令牌成本是NVIDIA H100集群难以匹敌的。
性能、能效与博通的经验
项目目标三重:提升推理任务性能、提高能源效率和更便捷的基础设施扩展。博通在定制芯片设计和供应链方面拥有丰富经验——同一家公司参与了谷歌TPU和Meta MTIA芯片的开发——表明与现有数据中心基础设施的高度集成。
详细技术规格——晶体管数量、内存带宽、支持的数值精度(FP8、BF16、INT8)——在首次宣告中尚未公布,这是芯片生产部署前早期披露的惯常做法。完整架构和基准测试结果预计将在后续公告中发布。
定制芯片竞赛——谷歌、亚马逊、微软、特斯拉
AI定制芯片竞争持续加剧。谷歌通过TPU v5e和v5p为Gemini实现了每令牌成本优势。AWS Trainium 2满足Anthropic的训练和推理需求。微软依赖Maia 100处理Azure AI工作负载。特斯拉使用Dojo处理自动驾驶。Jalapeño赋予OpenAI类似的筹码——从模型架构到运行模型的芯片优化整个栈的能力,无需依赖NVIDIA路线图和定价政策。
对行业的影响
如果OpenAI成功大规模生产部署Jalapeño,推理成本可能大幅下降——这将反映在ChatGPT API价格和未来更大模型的容量上。此举同时加大了对NVIDIA的压力:尽管2025财年AI芯片收入超过1000亿美元,越来越多的大客户正在开发替代方案。Jalapeño目前只是一项宣告——但其战略分量超越了尚未披露的技术细节。
常见问题
- Jalapeño芯片是什么,与NVIDIA GPU有何不同?
- Jalapeño是定制ASIC——专为LLM推理设计的集成电路,而NVIDIA GPU是用于各类任务的通用加速器。专用架构在特定语言模型工作负载上可实现更好的能效和更高的每瓦性能。
- OpenAI为何要开发自己的芯片而不继续购买NVIDIA硬件?
- 依赖单一供应商带来成本和供应链限制——在GPU需求旺盛的行业中尤为明显。通过自研芯片,OpenAI掌控基础设施,降低每令牌成本,并可针对自家模型专门优化硬件。