OpenAI: Jalapeño — NVIDIA 의존도를 줄이는 LLM 추론용 자체 ASIC 칩
OpenAI와 Broadcom이 공동으로 LLM 추론에 최적화된 커스텀 ASIC 칩 Jalapeño를 발표했습니다. OpenAI가 자체 실리콘 영역에 진입하는 전략적 행보로, Google TPU, Apple Neural Engine, AWS Trainium과 어깨를 나란히 하며 NVIDIA GPU 의존도를 낮춥니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
OpenAI와 Broadcom이 2026년 6월 24일 Jalapeño를 발표했습니다 — LLM 추론, 즉 훈련이 아닌 프로덕션에서 언어 모델을 실행하는 것에 최적화된 커스텀 ASIC 칩(특정 종류의 작업만을 위해 설계된 애플리케이션 특화 집적 회로). 이 발표는 전환점을 나타냅니다. OpenAI가 타사 하드웨어의 순수한 구매자에서 벗어나 자체 실리콘 스택 구축을 시작합니다.
Jalapeño는 왜 OpenAI에게 전략적 전환입니까?
지금까지 OpenAI는 인프라를 거의 전적으로 NVIDIA GPU에 의존했습니다 — 비용이 많이 들고, 전 세계적으로 수요가 많으며, 지난 몇 년간 수요가 공급 능력을 초과해 배송이 지연된 단일 공급업체가 통제하는 제품입니다. Jalapeño는 OpenAI를 Google(TPU — 텐서 처리 장치), Amazon(AWS Trainium), Apple(Neural Engine) 등 자체 실리콘 스택을 장악한 기업들과 어깨를 나란히 합니다. 이러한 칩들은 각각 특정 AI 워크로드를 위해 설계되어 해당 좁은 작업에서 범용 GPU보다 더 나은 성능 대 전력 비율을 달성합니다. 비교를 위해: Google은 TPU로 NVIDIA H100 클러스터가 맞추기 어려운 토큰당 비용으로 Gemini 모델을 실행합니다.
성능, 효율성, Broadcom의 경험
프로젝트의 목표는 세 가지입니다. 추론 작업의 더 높은 성능, 더 큰 에너지 효율성, 더 쉬운 인프라 확장성입니다. Broadcom은 커스텀 실리콘 설계의 오랜 경험과 공급망 역량을 제공합니다 — Google TPU와 Meta의 MTIA 칩 개발에 참여한 동일 회사 — 이는 기존 데이터센터 인프라와의 높은 수준의 통합을 시사합니다.
상세 기술 사양 — 트랜지스터 수, 메모리 대역폭, 지원 수치 정밀도(FP8, BF16, INT8) — 은 첫 번째 발표에서 공개되지 않았습니다. 이는 프로덕션 배포 전 초기 칩 공개 시 일반적인 접근법입니다. 완전한 아키텍처와 벤치마크 결과는 이후 발표에서 기대됩니다.
커스텀 실리콘 경쟁 — Google, Amazon, Microsoft, Tesla
AI에서 커스텀 실리콘 경쟁이 심화되고 있습니다. Google은 TPU v5e와 v5p로 Gemini의 토큰당 비용 우위를 달성했습니다. AWS Trainium 2는 Anthropic의 훈련 및 추론 요구를 충족합니다. Microsoft는 Azure AI 워크로드에 Maia 100을 사용합니다. Tesla는 자율 주행을 위해 Dojo를 사용합니다. Jalapeño는 OpenAI에게 유사한 레버를 제공합니다 — NVIDIA 로드맵과 가격 정책에 의존하지 않고 모델 아키텍처부터 실행되는 실리콘까지 전체 스택을 최적화하는 능력.
업계에 어떤 의미가 있습니까?
OpenAI가 Jalapeño를 대규모 프로덕션에 성공적으로 배포한다면 추론 비용이 크게 줄어들 수 있습니다 — ChatGPT API 가격과 미래의 더 큰 모델을 위한 용량에 영향을 미칠 것입니다. 이 행보는 또한 NVIDIA에 대한 압력을 강화합니다. 2025 회계연도 AI 칩 매출이 1,000억 달러를 초과했지만 점점 더 많은 대형 고객이 대안을 개발하고 있습니다. Jalapeño는 현재로서는 발표에 불과합니다 — 그러나 그 전략적 무게는 발표가 아직 공개하지 않은 기술적 세부 사항을 능가합니다.
자주 묻는 질문
- Jalapeño 칩이란 무엇이며 NVIDIA GPU와 어떻게 다릅니까?
- Jalapeño는 LLM 추론 전용으로 설계된 커스텀 ASIC입니다. 다양한 작업을 위한 범용 가속기인 NVIDIA GPU와 달리, 특화된 아키텍처는 언어 모델의 특정 워크로드에서 더 나은 전력 효율성과 성능을 제공합니다.
- OpenAI는 왜 NVIDIA 하드웨어를 계속 구매하는 대신 자체 칩을 개발합니까?
- 단일 공급업체 의존은 비용 및 공급 제약을 가져옵니다 — 특히 GPU 수요가 업계 전반에 걸쳐 높을 때. 자체 실리콘으로 OpenAI는 인프라를 통제하고, 토큰당 비용을 줄이며, 자체 모델에 맞게 하드웨어를 최적화할 수 있습니다.