从 Tokenmaxxing 到配额限制:企业 AI 成本危机
最初的“Tokenmaxxing”狂热——即企业通过鼓励无限制使用 AI 来推动普及——正迅速与运营成本的残酷现实发生碰撞。随着公司从实验阶段转向规模化阶段,一场新的斗争正在显现:如何防止庞大的 AI 预算被低价值、琐碎的任务所耗尽。
Token 配额制的兴起
今年早些时候,企业界的叙事核心是实现 AI 集成最大化。一些组织甚至实施了内部排行榜,通过游戏化手段奖励使用 AI 的员工。然而,这种不受约束的热情导致了一种现象:不可预测的支出正在侵蚀利润率。
我们现在正见证“Token 配额制”时代的到来。领导层不再鼓励员工在每一个可能的任务中使用大语言模型 (LLM),而是开始实施严格的控制。目标是从广泛、无管理的用法转向一种规范化的模式,即仅将 AI 应用于高影响、高价值的工作流中。
Accenture 案例:高昂代价与琐碎任务
全球咨询巨头 Accenture 就是这一转变的一个显著例子。根据 Accenture 智能体 AI 战略负责人 Justice Kwak 主持的一次内部会议泄露的音频显示,该公司正积极努力防止员工在基础行政任务上耗尽 Token 储备。
报告强调了一个显著的矛盾:虽然 Accenture 此前曾暗示,如果员工未能采用 AI,可能会“面临失去晋升的机会”,但他们现在正转向限制使用。具体而言,公司正试图阻止员工将昂贵的 AI 计算资源用于微小任务,例如将 PDF 转换为演示文稿。
Kwak 指出,AI 正处于一个“拐点”,正在成为企业成本结构中的重要组成部分。随着支出变得越来越不可预测,CFO、COO 和 CIO 在授权进一步支出之前,要求看到明确的投资回报率 (ROI) 证据。
在后炒作时代证明价值
这一转变反映了 AI 行业中一个更广泛的趋势,通常被称为“AI 抛售潮”。市场不再满足于生成式能力带来的新奇感,而是要求获得实实在在的生产力提升,以抵消计算和 Token 消耗带来的巨额成本。
随着行业从纯粹的炒作转向财务问责,这种经济压力正特别影响着依赖 AI 的行业,包括存储芯片制造商。为了使 AI 商业模式保持可持续性,重点必须从“使用了多少 AI”转向“这些 Token 被多有效地部署来解决复杂问题”。
核心要点
- 战略转型: 公司正从“Tokenmaxxing”(无限制使用)转向“Token 配额制”,以管理不可预测的运营成本。
- ROI 指令: 包括 CFO 和 CIO 在内的领导团队正在要求价值证明,不再仅仅满足于 AI 采用初期的兴奋感。
- 成本 vs. 效用: 一个主要的摩擦点正在显现,即昂贵的 LLM Token 正被浪费在 PDF 格式化等低价值任务上,而不是用于高影响的智能体工作流。
