我是如何防止 AI 功能掏空我的钱包的

我在我的个人项目中加入了一个 AI 聊天机器人。我原以为这很简单。

我错了。

两周后,我单周的 OpenAI 账单就达到了 87 美元。而我只有 50 个用户。我竟然在为一个兴趣项目亏钱。

我尝试了几种方法来降低成本。有些失败了。

我意识到问题在于重复劳动。LLM 在一遍又一遍地处理相同的想法。

我通过三个步骤解决了这个问题:

  1. 语义缓存 (Semantic Caching) 我不再寻找完全匹配的词汇,而是开始使用 embeddings 来寻找相似的问题。如果一个新问题与旧问题的相似度达到 92%,我就直接提供缓存的答案。这使得命中率达到了 40%,并将我的成本降低了一半。

  2. 智能模型路由 (Smart Model Routing) 我不再对所有任务都使用 GPT-4。我构建了一个路由。如果问题简短简单,我就使用廉价的服务商;如果问题很复杂,我才会将其发送给高级模型。大多数问题并不需要高端模型。

  3. 提示词精简 (Prompt Trimming) 我减少了发送给模型的上下文量。通过仅挑选最相关的数据块,我将上下文大小缩减了 60%。

结果:

经验教训:

添加 AI 不仅仅是关于提示词 (prompts)。它关乎经济效益。每一次 API 调用都是真金白银。如果你不为了效率而设计,你的项目将会失败。

你是如何管理你的 AI 成本的?

Source: https://dev.to/__c1b9e06dc90a7e0a676b/how-i-stopped-my-ai-feature-from-draining-my-wallet-20il