OpenAI y Broadcom presentan Jalapeño: un chip personalizado para la inferencia de LLM

OpenAI está trascendiendo oficialmente el ámbito del software al incursionar en el silicio personalizado con el anuncio de "Jalapeño", un Procesador de Inteligencia dedicado. Desarrollado en asociación con Broadcom, este acelerador personalizado está diseñado para optimizar la inferencia de modelos de lenguaje extensos (LLM) a una escala masiva.

Una arquitectura diseñada específicamente para los LLM modernos

A diferencia de muchas soluciones actuales que dependen de GPUs de propósito general modificadas, Jalapeño es un diseño creado desde cero, diseñado específicamente para las demandas únicas de la inferencia de LLM. El objetivo es resolver los principales cuellos de botella de la IA moderna: el movimiento de datos y la infrautilización del hardware. Al optimizar la arquitectura para acercar la utilización a su máximo teórico, OpenAI pretende mejorar significativamente el rendimiento por vatio en comparación con el hardware de vanguardia actual.

Aunque OpenAI aún no ha publicado un informe técnico finalizado ni comparativas (benchmarks) independientes, las primeras pruebas internas sugieren ganancias sustanciales de eficiencia. Las muestras de ingeniería ya se están utilizando en entornos de laboratorio para ejecutar cargas de trabajo complejas de aprendizaje automático, incluido el modelo GPT-5.3-Codex-Spark, un modelo que actualmente depende del hardware de Cerebras para sus necesidades de inferencia.

Una colaboración de alto impacto entre múltiples empresas

El desarrollo de Jalapeño es un sofisticado esfuerzo de múltiples socios que abarca todo el stack de hardware. OpenAI lidera el diseño del chip, aprovechando sus propios modelos de IA para acelerar el ciclo de desarrollo, que según se informa tomó solo nueve meses desde el diseño hasta el tape-out. Broadcom aporta la experiencia crítica en la fabricación de silicio y tecnología de red avanzada, incluyendo sus chips de red de alto rendimiento Tomahawk. Completando el ecosistema, Celestica es responsable de las placas, los racks y la integración completa del sistema.

Esta colaboración representa un cambio estratégico para OpenAI, pasando de ser una empresa centrada únicamente en modelos y productos a una que controla el stack de hardware subyacente. Al poseer el silicio, OpenAI puede, teóricamente, ejecutar sus modelos de forma más rápida, más fiable y a un coste mucho menor que sus competidores que dependen de proveedores externos.

Escalar a niveles de gigavatios para 2026

La hoja de ruta para Jalapeño es sumamente ambiciosa. El CEO de Broadcom, Hock Tan, ha indicado que el primer despliegue está previsto para finales de 2026, con la intención de operar a escala de gigavatios junto con Microsoft y otros socios estratégicos. La escala de este despliegue subraya los masivos requisitos de infraestructura de la IA de próxima generación.

Los informes sugieren que la asociación incluye compromisos comerciales significativos; se espera que Microsoft garantice la compra del 40 por ciento de la producción inicial de chips para asegurar la primera fase. Este nivel de integración vertical y demanda garantizada señala un movimiento importante hacia la estabilización de la cadena de suministro de alto coste y alto consumo energético necesaria para sostener la revolución de la IA.

Conclusiones clave

  • Estrategia de silicio personalizado: Jalapeño es un "Procesador de Inteligencia" diseñado desde cero para la inferencia de LLM, con el objetivo de superar al hardware de propósito general en rendimiento por vatio.
  • Desarrollo rápido: Utilizando sus propios modelos de IA para acelerar el proceso, OpenAI logró un ciclo de diseño a tape-out de nueve meses, un récord para los ASICs de alto rendimiento.
  • Despliegue a escala masiva: El primer despliegue a gran escala está previsto para finales de 2026 a escala de gigavatios, con el apoyo de Broadcom y Microsoft.