AIコストの問題はモデルではなく、アーキテクチャにあります。

Translated for your language. 原文を読む.

AI-assisted draft.

GyaanSetu Editorial2 週間前2分で読めます

AIの請求額が高いのは、モデルの問題ではありません。アーキテクチャの問題です。

LLMのコストが増大している場合、より安価なモデルへの切り替えを検討していることでしょう。例えば、GPT-4からGPT-4-miniへ移行するなどです。これは多少の助けにはなりますが、根本的な問題を解決することは稀です。

真の問題はワークフローにあります。多くの人は、あらゆるステップをLLM経由で処理しようとします。本来、言語的な推論を必要としないタスクに対しても、推論機能を使ってしまっているのです。

あらゆるAIワークフローには、4つの構成要素があります。

• トリガー：作業を開始する。コストはほぼゼロ。 • 決定論的ML（Deterministic ML）：データの分類やスコアリングを行う。これは安価。 • LLM：読み取り、書き込み、推論を行う。これは高価。 • ツール/API：データの取得や書き込みを行う。これは安価。

決定論的MLとLLMの間には、巨大な格差があります。LLMは、単純な分類器に比べて100倍から1000倍ものコストがかかることがあります。各ステップに適切なツールを選択しなければ、結果として常に高価な方を選んでしまうことになります。

サポートチケットシステムを例に見てみましょう。

不適切な設計では、チケットの全内容をLLMに送信します。LLMに対して、意図の分類、チケットの振り分け、返信のドラフト作成、そしてCRMの更新までを依頼します。これはコストがかかりすぎです。分類にLLMは必要ありません。テキストをカテゴリにマッピングする単純なモデルがあれば十分なのです。

より優れた設計は、以下のようになります。

この構成であれば、スパムチケットがLLMに到達することはありません。無益なタスクに対して「LLM税」を支払う必要がなくなるのです。

アーキテクチャを正しく設計すれば、モデルを変更する以前に、最も高価な呼び出しを排除できます。

コストを下げるために、以下のステップに従ってください。

どのモデルがトークン単価として最安かという議論はやめましょう。高価なエンジンを必要な時にだけ使うアーキテクチャの構築を始めるのです。

Optional learning community: https://t.me/GyaanSetuAi