OpenAI와 Broadcom, LLM 추론을 위한 맞춤형 칩 'Jalapeño' 공개
OpenAI가 전용 인텔리전스 프로세서인 "Jalapeño"를 발표하며 맞춤형 실리콘 분야로 진출, 공식적으로 소프트웨어를 넘어선 행보를 시작했습니다. Broadcom과의 파트너십을 통해 개발된 이 맞춤형 가속기는 대규모 언어 모델(LLM) 추론을 최적화하도록 설계되었습니다.
현대적 LLM을 위해 특수 설계된 아키텍처
수정된 범용 GPU에 의존하는 기존의 많은 솔루션과 달리, Jalapeño는 LLM 추론의 독특한 요구 사항에 맞춰 처음부터 새롭게 설계된 아키텍처입니다. 목표는 현대 AI의 주요 병목 현상인 데이터 이동과 하드웨어 저활용 문제를 해결하는 것입니다. 아키텍처를 최적화하여 활용도를 이론적 최대치에 가깝게 끌어올림으로써, OpenAI는 현재의 최첨단 하드웨어 대비 와트당 성능(performance per watt)을 크게 향상시키는 것을 목표로 합니다.
OpenAI가 아직 최종 기술 보고서나 독립적인 벤치마크를 공개하지는 않았지만, 초기 내부 테스트 결과 상당한 효율성 향상이 나타나고 있습니다. 엔지니어링 샘플은 이미 실험실 환경에서 복잡한 머신러닝 워크로드를 실행하는 데 사용되고 있으며, 여기에는 현재 추론을 위해 Cerebras 하드웨어에 의존하고 있는 GPT-5.3-Codex-Spark 모델도 포함됩니다.
다국적 기업들의 강력한 협업
Jalapeño의 개발은 하드웨어 스택 전체를 아우르는 정교한 다자간 파트너십의 결과물입니다. OpenAI는 칩 설계를 주도하며 자체 AI 모델을 활용해 개발 주기를 가속화했으며, 설계부터 테이프아웃(tape-out)까지 단 9개월밖에 걸리지 않은 것으로 알려졌습니다. Broadcom은 핵심적인 실리콘 제조 전문 지식과 고성능 Tomahawk 네트워킹 칩을 포함한 첨단 네트워킹 기술을 제공합니다. Celestica는 보드, 랙 및 전체 시스템 통합을 담당하며 생태계를 완성합니다.
이러한 협업은 모델과 제품에만 집중하던 기업에서 하부 하드웨어 스택까지 제어하는 기업으로 변화하려는 OpenAI의 전략적 전환을 의미합니다. 실리콘을 직접 소유함으로써 OpenAI는 이론적으로 제3자 제공업체에 의존하는 경쟁사들보다 모델을 더 빠르고 안정적이며 훨씬 저렴한 비용으로 실행할 수 있습니다.
2026년까지 기가와트급 규모로 확장
Jalapeño의 로드맵은 매우 야심 차게 설정되어 있습니다. Broadcom의 CEO Hock Tan은 Microsoft 및 기타 전략적 파트너와 함께 기가와트 규모로 운영하는 것을 목표로, 2026년 말에 첫 배포를 계획하고 있다고 밝혔습니다. 이러한 배포 규모는 차세대 AI에 필요한 막대한 인프라 요구 사항을 잘 보여줍니다.
보고에 따르면 이번 파트너십에는 상당한 상업적 약속이 포함되어 있으며, Microsoft는 첫 단계를 확보하기 위해 초기 칩 생산량의 40%를 구매하기로 보장할 것으로 알려졌습니다. 이러한 수준의 수직 계열화와 보장된 수요는 AI 혁명을 지속하는 데 필요한 고비용, 고에너지 공급망을 안정화하기 위한 중대한 움직임을 시사합니다.
핵심 요약
- 맞춤형 실리콘 전략: Jalapeño는 LLM 추론을 위해 처음부터 설계된 "인텔리전스 프로세서"로, 와트당 성능 면에서 범용 하드웨어를 능가하는 것을 목표로 합니다.
- 신속한 개발: 자체 AI 모델을 사용하여 프로세스 속도를 높임으로써, OpenAI는 고성능 ASIC 분야의 기록적인 수치인 설계부터 테이프아웃까지 9개월의 주기를 달성했습니다.
- 대규모 배포: Broadcom과 Microsoft의 지원을 받아 2026년 말 기가와트 규모의 첫 대규모 배포를 목표로 하고 있습니다.
