OpenAI 发布 Jalapeño:其首款定制 AI 推理芯片

OpenAI 正式宣布推出 Jalapeño,这是其与 Broadcom 合作开发的、首款定制推理处理器,标志着 OpenAI 正式进入芯片竞赛。这一战略举措标志着 OpenAI 基础设施战略的重大转变,旨在优化其大规模模型向用户部署的方式。

打破对 Nvidia GPU 的依赖

多年来,AI 行业一直严重依赖 Nvidia 的高端 GPU。然而,OpenAI 正通过开发自己的“AI 加速器”(旨在处理特定机器学习工作负载的专用硅片)加入 Google 和 Amazon 等科技巨头的行列。虽然 Nvidia 在预训练前沿模型所需的海量计算能力方面仍是金标准,但 OpenAI 的目标是下一个关键瓶颈:推理。

Jalapeño 是专门为推理阶段设计的,即预训练模型处理用户指令并生成输出的阶段。通过专注于这一特定阶段,OpenAI 旨在减少对通用硬件的依赖,并实现对运营成本的精细化控制。

每瓦性能与经济效率

关于 Jalapeño 最重要的技术主张之一是其效率。OpenAI 表示,早期测试显示,与目前最先进的替代方案相比,该芯片提供了显著更高的每瓦性能。在超大规模 AI 的世界里,能效不仅是一个技术指标,更是核心的经济驱动力。

该公司特别强调了该芯片在运行实时编程模型时降低运营成本的能力。随着 OpenAI 扩展其智能体(agentic)产品(如 Codex),以更低的单 token 成本运行复杂推理任务的能力,对于维持健康的利润率以及让开发者和企业用户都能负担得起 AI 至关重要。

垂直整合:优化全栈 AI

Jalapeño 的开发证明了 OpenAI 对垂直整合的承诺。该公司不再仅仅是一个模型构建者,正在成为一名基础设施提供商。OpenAI 的战略涉及优化技术栈的每一层,包括芯片架构、内核(kernels)、内存系统、网络和部署调度。

有趣的是,OpenAI 利用其自身的 AI 模型来辅助 Jalapeño 芯片的设计与开发。这种反馈循环——即由 AI 设计最终运行下一代 AI 的硬件——代表了硬件工程的一次复杂演进。通过控制硬件,OpenAI 可以确保其软件与硅片完美同步,从而实现更快、更可靠的模型性能。

核心要点

  • 针对性推理: Jalapeño 是由 OpenAI 和 Broadcom 设计的定制推理处理器,旨在优化模型的部署,而非初始训练过程。
  • 效率提升: 早期结果表明其具有卓越的每瓦性能,特别针对编程模型等实时应用,旨在降低运营成本。
  • 全栈战略: OpenAI 正朝着完全垂直整合的方向迈进,设计从芯片架构、内存系统到在其上运行的智能体产品的一切内容。