OpenAI e Broadcom revelam Jalapeño: um chip personalizado para inferência de LLM
A OpenAI está oficialmente indo além do software ao se aventurar no silício personalizado com o anúncio do "Jalapeño", um Processador de Inteligência dedicado. Desenvolvido em parceria com a Broadcom, este acelerador personalizado foi projetado para otimizar a inferência de modelos de linguagem de grande escala (LLM) em uma escala massiva.
Uma arquitetura construída especificamente para LLMs modernos
Ao contrário de muitas soluções atuais que dependem de GPUs de uso geral modificadas, o Jalapeño é um projeto desenvolvido do zero, projetado especificamente para as demandas únicas da inferência de LLM. O objetivo é resolver os principais gargalos da IA moderna: movimentação de dados e subutilização de hardware. Ao otimizar a arquitetura para aproximar a utilização de seu máximo teórico, a OpenAI visa melhorar significativamente o desempenho por watt em comparação com o hardware de ponta atual.
Embora a OpenAI ainda não tenha lançado um relatório técnico finalizado ou benchmarks independentes, testes internos iniciais sugerem ganhos substanciais de eficiência. Amostras de engenharia já estão sendo utilizadas em ambientes de laboratório para executar cargas de trabalho complexas de machine learning, incluindo o modelo GPT-5.3-Codex-Spark — um modelo que atualmente depende do hardware da Cerebras para suas necessidades de inferência.
Uma colaboração poderosa entre várias empresas
O desenvolvimento do Jalapeño é um esforço sofisticado de múltiplos parceiros que abrange toda a pilha de hardware. A OpenAI lidera o design do chip, aproveitando seus próprios modelos de IA para acelerar o ciclo de desenvolvimento, que, segundo relatos, levou apenas nove meses do design ao tape-out. A Broadcom fornece a expertise crítica de fabricação de silício e tecnologia de rede avançada, incluindo seus chips de rede de alto desempenho Tomahawk. Completando o ecossistema, a Celestica é responsável pelas placas, racks e integração total do sistema.
Esta colaboração representa uma mudança estratégica para a OpenAI, passando de uma empresa focada apenas em modelos e produtos para uma que controla a pilha de hardware subjacente. Ao possuir o silício, a OpenAI pode, teoricamente, executar seus modelos de forma mais rápida, mais confiável e a um custo muito menor do que os concorrentes que dependem de provedores terceirizados.
Escalando para níveis de gigawatts até 2026
O roadmap para o Jalapeño é altamente ambicioso. O CEO da Broadcom, Hock Tan, indicou que a primeira implantação está planejada para o final de 2026, com a intenção de operar em escala de gigawatts ao lado da Microsoft e de outros parceiros estratégicos. A escala desta implementação ressalta os requisitos massivos de infraestrutura da IA de próxima geração.
Relatos sugerem que a parceria inclui compromissos comerciais significativos, com a expectativa de que a Microsoft garanta a compra de 40% da produção inicial de chips para assegurar a primeira fase. Este nível de integração vertical e demanda garantida sinaliza um grande movimento em direção à estabilização da cadeia de suprimentos de alto custo e alto consumo de energia necessária para sustentar a revolução da IA.
Principais Conclusões
- Estratégia de Silício Personalizado: O Jalapeño é um "Processador de Inteligência" projetado do zero para inferência de LLM, visando superar o hardware de uso geral em desempenho por watt.
- Desenvolvimento Rápido: Usando seus próprios modelos de IA para acelerar o processo, a OpenAI alcançou um ciclo de nove meses do design ao tape-out, um recorde para ASICs de alto desempenho.
- Implantação em Escala Massiva: A primeira implantação em larga escala está prevista para o final de 2026 em escala de gigawatts, com o apoio da Broadcom e da Microsoft.
