Mistral Large vs Mistral Medium: 本番環境からのCTOノート

3ヶ月前、私はLLM機能をリリースしました。そして、請求書が届きました。

私は間違いに気づきました。Mistral Mediumを使うべきところで、Mistral Largeを使ってしまったのです。その結果、必要以上に4倍近いコストがかかってしまいました。

スタートアップを運営しているなら、「なんとなく」でアーキテクチャの選択をしてはいけません。ROI(投資対効果)に基づいて判断する必要があります。

間違いは単純でした。モデルは大きければ大きいほど常に良いと思い込んでいたのです。それは間違いでした。

現在、私がLLMコストを管理している方法は以下の通りです:

  1. タスクの複雑さを分類する
  1. トークン量を予測する
  1. 実際の評価(evals)で測定する

私のタスクの70%において、Mistral Mediumで十分です。サポートチケットの分類も完璧にこなします。コストはLargeの3分の1です。Largeは高度な推論タスクのために取っておいています。

また、ベンダーロックインも避けています。多くのモデルにアクセスするために、統一されたエンドポイントを使用しています。プロバイダーが値上げをしても、数分でモデルを切り替えられます。これがランウェイを守ることにつながります。

CTOへのアドバイス:

小さなハンマーで済むタスクに、スレッジハンマーを使うのはやめましょう。効率性は競争優位性を生み出します。それによって、ユーザーに対してより優れた機能とより低い価格を提供できるようになるのです。

出典: https://dev.to/gentlenode/mistral-large-vs-mistral-medium-cto-notes-from-production-280f