OpenAI 与 Broadcom 发布 Jalapeño:一款用于 LLM 推理的定制芯片
OpenAI 通过宣布推出专用智能处理器“Jalapeño”,正式从软件领域迈向定制化硅片领域。这款定制加速器是与 Broadcom 合作开发的,旨在实现大规模大语言模型 (LLM) 推理的优化。
为现代 LLM 量身定制的架构
与许多依赖于改进型通用 GPU 的现有解决方案不同,Jalapeño 是从零开始设计的,专门针对 LLM 推理的独特需求而构建。其目标是解决现代 AI 的主要瓶颈:数据移动和硬件利用率不足。通过优化架构以使利用率更接近理论最大值,OpenAI 旨在显著提高单位功耗性能 (performance per watt),使其优于目前最先进的硬件。
虽然 OpenAI 尚未发布最终的技术报告或独立的基准测试,但早期的内部测试表明效率有了实质性的提升。工程样品已在实验室环境中用于运行复杂的机器学习工作负载,包括 GPT-5.3-Codex-Spark 模型——该模型目前在推理需求上仍依赖 Cerebras 硬件。
多方强强联手的协作
Jalapeño 的开发是一项复杂的、跨越整个硬件栈的多方合作伙伴协作。OpenAI 领导芯片设计,利用其自身的 AI 模型来加速开发周期,据报道,从设计到流片 (tape-out) 仅用了九个月。Broadcom 提供关键的硅片制造专业知识和先进的网络技术,包括其高性能的 Tomahawk 网络芯片。Celestica 则负责板卡、机架及完整的系统集成,从而完善了整个生态系统。
此次合作代表了 OpenAI 的战略转型,使其从一家仅专注于模型和产品的公司,转变为一家能够控制底层硬件栈的公司。通过掌握硅片技术,OpenAI 从理论上讲可以比依赖第三方供应商的竞争对手更快、更可靠地运行其模型,且成本要低得多。
到 2026 年实现吉瓦 (Gigawatt) 级规模
Jalapeño 的路线图极具雄心。Broadcom CEO Hock Tan 表示,计划在 2026 年底进行首次部署,并打算与 Microsoft 及其他战略合作伙伴一起,以吉瓦级规模进行运营。这一部署规模凸显了下一代 AI 对基础设施的巨大需求。
有报告指出,该合作伙伴关系包含重大的商业承诺,据报道,Microsoft 预计将保证购买首批芯片产量的 40%,以确保第一阶段的顺利进行。这种程度的垂直整合和保障需求,标志着在稳定维持 AI 革命所需的高成本、高能耗供应链方面迈出了重要一步。
核心要点
- 定制化硅片战略: Jalapeño 是一款专为 LLM 推理从零开始设计的“智能处理器”,旨在单位功耗性能方面超越通用硬件。
- 快速开发: 通过利用自身的 AI 模型来加速流程,OpenAI 实现了从设计到流片仅需九个月的周期,这在高性能 ASIC 领域创下了纪录。
- 大规模部署: 在 Broadcom 和 Microsoft 的支持下,首次大规模部署的目标定于 2026 年底,规模达到吉瓦级。
