AI機能による出費をどう食い止めたか

Machine-translated. Read the original.

📅2 hours ago⏱2 min read

AI機能による財布の枯渇をどう防いだか

サイドプロジェクトにAIチャットボットを追加しました。簡単だろうと思っていました。

しかし、それは間違いでした。

2週間後、OpenAIの請求額はたった1週間で87ドルに達しました。ユーザーはわずか50人しかいませんでした。趣味のプロジェクトで赤字を出していたのです。

コストを抑えるためにいくつかの方法を試しましたが、失敗したものもありました。

問題は「重複した作業」にあると気づきました。LLMが同じような内容を何度も繰り返し処理していたのです。

私は3つのステップでこれを解決しました。

セマンティック・キャッシュ (Semantic Caching) 単語の完全一致を探すのをやめました。代わりにembeddings（埋め込み）を使用して、似た質問を見つけるようにしました。新しい質問が過去の質問と92%一致する場合、キャッシュされた回答を返します。これによりヒット率は40%に達し、コストを半分に削減できました。
スマートなモデル・ルーティング (Smart Model Routing) 何でもかんでもGPT-4を使うのをやめました。ルーターを構築しました。質問が短くて単純な場合は安価なプロバイダーを使用し、複雑な質問の場合はプレミアムモデルに送るようにしました。ほとんどの質問にハイエンドなモデルは必要ありません。
プロンプトのトリミング (Prompt Trimming) モデルに送るコンテキストの量を減らしました。最も関連性の高いデータチャンクのみを選択することで、コンテキストのサイズを60%削減しました。

結果：

学んだ教訓：

AIの導入は、単にプロンプトの問題ではありません。経済性の問題です。APIコールはすべて、実際のお金がかかります。効率性を考慮して設計しなければ、プロジェクトは失敗します。

あなたはどのようにAIコストを管理していますか？

Continue reading