OpenAI 与 Broadcom 发布 Jalapeño：用于 LLM 推理的定制芯片

Translated for your language. 阅读原文.

AI-assisted draft.

OpenAI 与 Broadcom 发布 Jalapeño：用于 LLM 推理的定制芯片

本文目录

OpenAI 与 Broadcom 发布 Jalapeño：一款用于 LLM 推理的定制芯片

OpenAI 通过宣布推出专用智能处理器“Jalapeño”，正式从软件领域迈向定制化硅片领域。这款定制加速器是与 Broadcom 合作开发的，旨在实现大规模大语言模型 (LLM) 推理的优化。

为现代 LLM 量身定制的架构

与许多依赖于改进型通用 GPU 的现有解决方案不同，Jalapeño 是从零开始设计的，专门针对 LLM 推理的独特需求而构建。其目标是解决现代 AI 的主要瓶颈：数据移动和硬件利用率不足。通过优化架构以使利用率更接近理论最大值，OpenAI 旨在显著提高单位功耗性能 (performance per watt)，使其优于目前最先进的硬件。

虽然 OpenAI 尚未发布最终的技术报告或独立的基准测试，但早期的内部测试表明效率有了实质性的提升。工程样品已在实验室环境中用于运行复杂的机器学习工作负载，包括 GPT-5.3-Codex-Spark 模型——该模型目前在推理需求上仍依赖 Cerebras 硬件。

多方强强联手的协作

Jalapeño 的开发是一项复杂的、跨越整个硬件栈的多方合作伙伴协作。OpenAI 领导芯片设计，利用其自身的 AI 模型来加速开发周期，据报道，从设计到流片 (tape-out) 仅用了九个月。Broadcom 提供关键的硅片制造专业知识和先进的网络技术，包括其高性能的 Tomahawk 网络芯片。Celestica 则负责板卡、机架及完整的系统集成，从而完善了整个生态系统。

此次合作代表了 OpenAI 的战略转型，使其从一家仅专注于模型和产品的公司，转变为一家能够控制底层硬件栈的公司。通过掌握硅片技术，OpenAI 从理论上讲可以比依赖第三方供应商的竞争对手更快、更可靠地运行其模型，且成本要低得多。

到 2026 年实现吉瓦 (Gigawatt) 级规模

Jalapeño 的路线图极具雄心。Broadcom CEO Hock Tan 表示，计划在 2026 年底进行首次部署，并打算与 Microsoft 及其他战略合作伙伴一起，以吉瓦级规模进行运营。这一部署规模凸显了下一代 AI 对基础设施的巨大需求。

有报告指出，该合作伙伴关系包含重大的商业承诺，据报道，Microsoft 预计将保证购买首批芯片产量的 40%，以确保第一阶段的顺利进行。这种程度的垂直整合和保障需求，标志着在稳定维持 AI 革命所需的高成本、高能耗供应链方面迈出了重要一步。

核心要点

定制化硅片战略： Jalapeño 是一款专为 LLM 推理从零开始设计的“智能处理器”，旨在单位功耗性能方面超越通用硬件。
快速开发： 通过利用自身的 AI 模型来加速流程，OpenAI 实现了从设计到流片仅需九个月的周期，这在高性能 ASIC 领域创下了纪录。
大规模部署： 在 Broadcom 和 Microsoft 的支持下，首次大规模部署的目标定于 2026 年底，规模达到吉瓦级。

OpenAI 与 Broadcom 发布 Jalapeño：用于 LLM 推理的定制芯片

OpenAI 与 Broadcom 发布 Jalapeño：一款用于 LLM 推理的定制芯片

为现代 LLM 量身定制的架构

多方强强联手的协作

到 2026 年实现吉瓦 (Gigawatt) 级规模

核心要点

继续阅读

OpenAI 发布 Jalapeño：其首款定制化 AI 推理芯片

OpenAI 发布 Jalapeño：其首款定制 AI 推理芯片

数学背后的逻辑：OpenAI 的 Jalapeño 芯片如何针对 AI 经济学进行布局

OpenAI 的 Jalapeño 芯片：摆脱英伟达主导地位的战略转型

The Silicon Shift: Why Tech Giants Are Building Custom AI Chips