OpenAI 为游客用户大幅削减 ChatGPT 推理成本，降幅超过 50%

Translated for your language. 阅读原文.

AI-assisted draft.

本文目录

OpenAI 将 ChatGPT 访客用户的推理成本削减了 50% 以上

OpenAI 通过将 ChatGPT 访客用户的推理成本降低一半以上，在运营效率方面取得了重大突破。运行现有 AI 模型成本的大幅降低，标志着在大规模 AI 部署实现可持续性方面迈出了关键一步。

根据 The Information 的报道，OpenAI 的工程师已成功实施了专门针对无需账号即可使用 ChatGPT 的访客的新优化方案。虽然与 Plus 或 Team 订阅用户相比，访客用户目前只能使用有限的功能，但其对硬件需求的影响是深远的。

通过这些优化获得的效率提升，已将服务这些特定用户所需的 Nvidia GPU 数量减少到仅几百个。虽然实现这些收益的具体方法仍属于商业机密，但这种削减规模表明 OpenAI 在管理计算密集型推理工作负载方面取得了重大飞跃。

这一进展正值行业发展的关键时刻，因为高昂的计算成本仍然是扩展 AI 服务的主要瓶颈。OpenAI 并非唯一关注这一“效率前沿”的参与者。最近，DeepSeek 发布了一种新的开源方法，能够将推理请求的速度提高 60% 到 85%。

随着竞争的加剧，焦点正在从单纯构建更大的模型，转向构建更智能、更具成本效益的模型运行方式。对于 AI 实验室而言，推理成本每节省一个百分点，都能直接转化为“喘息空间”——即可以重新分配到训练下一代模型、降低响应延迟或提高利润率上的额外资源。

虽然这些优化目前仅适用于产品的一个有限子集，但它们预示着 AI 战略的更广泛转变。随着数据中心的建设难以跟上计算需求的指数级增长，软件层面的优化正变得与硬件扩展同样重要。

如果 OpenAI 能成功将这些节省推理成本的技术从访客界面移植到全功能的 ChatGPT 产品中，它可能会从根本上改变消费级 AI 的经济模式。对于开发者和创始人来说，这凸显了一个日益增长的趋势：最成功的 AI 公司将不仅仅是那些拥有最多参数的公司，而是那些拥有最高效推理流水线的公司。