🔴 🔧 하드웨어 게시일: · 2 분 읽기 ·

OpenAI: Jalapeño — NVIDIA 의존도를 줄이는 LLM 추론용 자체 ASIC 칩

편집 일러스트: 회로 기판 위 Jalapeno라고 표시된 미래형 AI 추론 칩, 녹색 액센트 조명, 얼굴이나 텍스트 없음

OpenAI와 Broadcom이 공동으로 LLM 추론에 최적화된 커스텀 ASIC 칩 Jalapeño를 발표했습니다. OpenAI가 자체 실리콘 영역에 진입하는 전략적 행보로, Google TPU, Apple Neural Engine, AWS Trainium과 어깨를 나란히 하며 NVIDIA GPU 의존도를 낮춥니다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.

OpenAI와 Broadcom이 2026년 6월 24일 Jalapeño를 발표했습니다 — LLM 추론, 즉 훈련이 아닌 프로덕션에서 언어 모델을 실행하는 것에 최적화된 커스텀 ASIC 칩(특정 종류의 작업만을 위해 설계된 애플리케이션 특화 집적 회로). 이 발표는 전환점을 나타냅니다. OpenAI가 타사 하드웨어의 순수한 구매자에서 벗어나 자체 실리콘 스택 구축을 시작합니다.

Jalapeño는 왜 OpenAI에게 전략적 전환입니까?

지금까지 OpenAI는 인프라를 거의 전적으로 NVIDIA GPU에 의존했습니다 — 비용이 많이 들고, 전 세계적으로 수요가 많으며, 지난 몇 년간 수요가 공급 능력을 초과해 배송이 지연된 단일 공급업체가 통제하는 제품입니다. Jalapeño는 OpenAI를 Google(TPU — 텐서 처리 장치), Amazon(AWS Trainium), Apple(Neural Engine) 등 자체 실리콘 스택을 장악한 기업들과 어깨를 나란히 합니다. 이러한 칩들은 각각 특정 AI 워크로드를 위해 설계되어 해당 좁은 작업에서 범용 GPU보다 더 나은 성능 대 전력 비율을 달성합니다. 비교를 위해: Google은 TPU로 NVIDIA H100 클러스터가 맞추기 어려운 토큰당 비용으로 Gemini 모델을 실행합니다.

성능, 효율성, Broadcom의 경험

프로젝트의 목표는 세 가지입니다. 추론 작업의 더 높은 성능, 더 큰 에너지 효율성, 더 쉬운 인프라 확장성입니다. Broadcom은 커스텀 실리콘 설계의 오랜 경험과 공급망 역량을 제공합니다 — Google TPU와 Meta의 MTIA 칩 개발에 참여한 동일 회사 — 이는 기존 데이터센터 인프라와의 높은 수준의 통합을 시사합니다.

상세 기술 사양 — 트랜지스터 수, 메모리 대역폭, 지원 수치 정밀도(FP8, BF16, INT8) — 은 첫 번째 발표에서 공개되지 않았습니다. 이는 프로덕션 배포 전 초기 칩 공개 시 일반적인 접근법입니다. 완전한 아키텍처와 벤치마크 결과는 이후 발표에서 기대됩니다.

커스텀 실리콘 경쟁 — Google, Amazon, Microsoft, Tesla

AI에서 커스텀 실리콘 경쟁이 심화되고 있습니다. Google은 TPU v5e와 v5p로 Gemini의 토큰당 비용 우위를 달성했습니다. AWS Trainium 2는 Anthropic의 훈련 및 추론 요구를 충족합니다. Microsoft는 Azure AI 워크로드에 Maia 100을 사용합니다. Tesla는 자율 주행을 위해 Dojo를 사용합니다. Jalapeño는 OpenAI에게 유사한 레버를 제공합니다 — NVIDIA 로드맵과 가격 정책에 의존하지 않고 모델 아키텍처부터 실행되는 실리콘까지 전체 스택을 최적화하는 능력.

업계에 어떤 의미가 있습니까?

OpenAI가 Jalapeño를 대규모 프로덕션에 성공적으로 배포한다면 추론 비용이 크게 줄어들 수 있습니다 — ChatGPT API 가격과 미래의 더 큰 모델을 위한 용량에 영향을 미칠 것입니다. 이 행보는 또한 NVIDIA에 대한 압력을 강화합니다. 2025 회계연도 AI 칩 매출이 1,000억 달러를 초과했지만 점점 더 많은 대형 고객이 대안을 개발하고 있습니다. Jalapeño는 현재로서는 발표에 불과합니다 — 그러나 그 전략적 무게는 발표가 아직 공개하지 않은 기술적 세부 사항을 능가합니다.

자주 묻는 질문

Jalapeño 칩이란 무엇이며 NVIDIA GPU와 어떻게 다릅니까?
Jalapeño는 LLM 추론 전용으로 설계된 커스텀 ASIC입니다. 다양한 작업을 위한 범용 가속기인 NVIDIA GPU와 달리, 특화된 아키텍처는 언어 모델의 특정 워크로드에서 더 나은 전력 효율성과 성능을 제공합니다.
OpenAI는 왜 NVIDIA 하드웨어를 계속 구매하는 대신 자체 칩을 개발합니까?
단일 공급업체 의존은 비용 및 공급 제약을 가져옵니다 — 특히 GPU 수요가 업계 전반에 걸쳐 높을 때. 자체 실리콘으로 OpenAI는 인프라를 통제하고, 토큰당 비용을 줄이며, 자체 모델에 맞게 하드웨어를 최적화할 수 있습니다.