OpenAI 发布 Jalapeño:其首款定制化 AI 推理芯片
OpenAI 正式宣布推出 Jalapeño,这是一款与 Broadcom 合作开发的定制化智能处理器,标志着 OpenAI 正式进入芯片竞赛。这一战略举措预示着这家 AI 巨头在扩展基础设施以及应对未来大语言模型巨大计算需求方面,将发生重大转变。
超越 Nvidia:ASIC 的崛起
多年来,AI 行业一直受限于 Nvidia 的高性能 GPU。然而,OpenAI 现在正通过 Jalapeño 转向一种专业化的路径,这是一款专用集成电路(ASIC)。与通用 GPU 不同,这款 ASIC 是专为 AI 推理而设计的——推理是模型(如 ChatGPT 或 Codex)处理用户请求并生成实时响应的关键阶段。
通过专门为推理设计硬件,OpenAI 旨在优化其现有模型运行的效率。在此之前,OpenAI 仅在九个月前就宣布了与 Broadcom 的合作伙伴关系,其目的正是为了减少对 Nvidia 供应受限硬件的过度依赖。
在性能上比肩行业巨头
Jalapeño 的技术雄心十分显著。Broadcom 首席执行官 Hock Tan 表示,该芯片的设计目标是达到行业基准的性能水平,特别是 Nvidia 的 Blackwell 架构和 Google 的 Tensor Processing Units (TPUs)。
虽然 Microsoft、Meta 和 Amazon 等竞争对手也推出了定制化芯片来为其数据中心提供动力,但 OpenAI 正专注于一个关键指标:效率。早期测试表明,Jalapeño 的能效比(performance-per-watt)将显著优于目前最先进的解决方案。在海量规模的 AI 部署领域,电力成本和散热管理是主要的瓶颈,这种效率优势可能会成为决定性的竞争优势。
多代计算战略
OpenAI 并未将 Jalapeño 视为一次性的硬件发布。相反,该公司将其描述为“多代计算平台的首步”。这表明公司有一个长期的路线图,旨在构建一个垂直整合的技术栈,使软件(LLMs)与硬件(ASICs)能够协同设计,从而实现最大的协同效应。
公司预计将在 2026 年底前开始部署这一全新的计算平台。随着模型复杂度的增加以及智能体(agentic)工作流变得更加普遍,拥有专用芯片将使 OpenAI 能够降低延迟,并减少大规模运行前沿级智能所带来的天文数字般的成本。
为什么这对 AI 生态系统至关重要
OpenAI 进入芯片设计领域标志着 AI 行业的成熟。我们正在从“无约束的硬件消耗”阶段转向“专业化硬件优化”阶段。随着 AI 智能体的兴起,推理需求激增,控制底层芯片的能力将决定哪些公司能够实现可持续扩展,而哪些公司将继续受制于 GPU 供应链。
核心要点
- 专业化重点: Jalapeño 是一款专为 AI 推理设计的 ASIC,旨在优化运行 ChatGPT 等模型的速度和成本。
- 性能基准: 该芯片与 Broadcom 共同开发,旨在性能上媲美 Nvidia 的 Blackwell 和 Google 的 TPUs,同时提供更卓越的能效比。
- 长期路线图: Jalapeño 预计将于 2026 年底前部署,它是多代硬件平台的基础,旨在减少对第三方 GPU 的依赖。
