𝗜 𝗖𝘂𝘁 𝗠𝘆 𝗔𝗜 𝗔𝗣𝗜 𝗖𝗼𝘀𝘁𝘀 𝗕𝘆 𝟳𝟬%

Translated for your language. 原文を読む.

AI-assisted draft.

2 週間前1分で読めます

AI APIのコストを70%削減した話

OpenAIの請求額が30ドルから150ドルに跳ね上がりました。原因は、小さなSlackボットでした。プロンプトの繰り返しとリトライが、膨大なコストを生んでいました。

簡単な修正も試しました。基本的なキャッシュを利用しました。モデルを切り替えました。しかし、どれも効果はありませんでした。ユーザーは質問の言い回しを変えます。言葉が変わると、基本的なキャッシュは機能しません。

そこで、AIプロキシを構築しました。これはアプリとAPIの間に位置します。役割は3つあります：

これにより、コストを70%削減できました。

ただし、トレードオフもあります：

皆さんへの教訓：

AI APIをブラックボックスとして扱うのはやめましょう。それらはHTTPエンドポイントに過ぎません。ミドルウェアを使って制御しましょう。

あなたの構成はどうなっていますか？既存のサービスを使っていますか、それとも自作していますか？

続きを読む