OpenAI 将 ChatGPT 访客用户的推理成本削减了 50% 以上

OpenAI 通过将 ChatGPT 访客用户的推理成本降低一半以上,在运营效率方面取得了重大突破。运行现有 AI 模型成本的大幅降低,标志着在大规模 AI 部署实现可持续性方面迈出了关键一步。

优化访客体验

根据 The Information 的报道,OpenAI 的工程师已成功实施了专门针对无需账号即可使用 ChatGPT 的访客的新优化方案。虽然与 Plus 或 Team 订阅用户相比,访客用户目前只能使用有限的功能,但其对硬件需求的影响是深远的。

通过这些优化获得的效率提升,已将服务这些特定用户所需的 Nvidia GPU 数量减少到仅几百个。虽然实现这些收益的具体方法仍属于商业机密,但这种削减规模表明 OpenAI 在管理计算密集型推理工作负载方面取得了重大飞跃。

推理效率之争

这一进展正值行业发展的关键时刻,因为高昂的计算成本仍然是扩展 AI 服务的主要瓶颈。OpenAI 并非唯一关注这一“效率前沿”的参与者。最近,DeepSeek 发布了一种新的开源方法,能够将推理请求的速度提高 60% 到 85%。

随着竞争的加剧,焦点正在从单纯构建更大的模型,转向构建更智能、更具成本效益的模型运行方式。对于 AI 实验室而言,推理成本每节省一个百分点,都能直接转化为“喘息空间”——即可以重新分配到训练下一代模型、降低响应延迟或提高利润率上的额外资源。

对更广泛 AI 版图的影响

虽然这些优化目前仅适用于产品的一个有限子集,但它们预示着 AI 战略的更广泛转变。随着数据中心的建设难以跟上计算需求的指数级增长,软件层面的优化正变得与硬件扩展同样重要。

如果 OpenAI 能成功将这些节省推理成本的技术从访客界面移植到全功能的 ChatGPT 产品中,它可能会从根本上改变消费级 AI 的经济模式。对于开发者和创始人来说,这凸显了一个日益增长的趋势:最成功的 AI 公司将不仅仅是那些拥有最多参数的公司,而是那些拥有最高效推理流水线的公司。

核心要点

  • 大幅降低成本: 据报道,OpenAI 通过新的工程优化,将非账号 ChatGPT 用户的推理成本降低了 50% 以上。
  • 硬件效率: 该优化已将服务访客用户所需的 Nvidia GPU 规模大幅缩减至仅几百个单位。
  • 行业趋势: 随着硬件供应仍受限制,行业正转向推理速度的突破,效仿 DeepSeek 等竞争对手采取类似的效率提升举措。