我将 AI API 成本降低了 70%

Translated for your language. 阅读原文.

AI-assisted draft.

2周前1分钟阅读

我将我的 AI API 成本降低了 70%

我的 OpenAI 账单从 30 美元飙升到了 150 美元。一个小小的 Slack 机器人导致了这一切。重复的提示词（prompts）和重试消耗了太多成本。

我尝试过简单的修复方法。我使用了基础缓存。我更换了模型。但都没有效果。用户会重新组织问题的措辞。当措辞发生变化时，基础缓存就会失效。

我构建了一个 AI 代理（proxy）。它位于我的应用程序和 API 之间。它主要做三件事：

这让我的成本降低了 70%。

这也存在权衡：

给你的建议：

不要再把 AI API 当作黑盒了。它们本质上就是 HTTP 端点。使用中间件来控制它们。

你的配置是怎样的？你是使用现成服务还是自己构建？

继续阅读