低予算でWordPress AIチャットボットを構築した方法
WordPressサイトのドキュメント用にAIチャットボットが必要でした。毎日同じようなサポートメールに返信するのをやめたかったのです。
GPT-4oのようなハイエンドモデルは高価です。入力トークン100万件あたり2.50ドル、出力トークン100万件あたり10.00ドルのコストを目にしました。小規模なサイドプロジェクトにとって、これらの価格は高すぎます。
2週間かけてさまざまなプロバイダーをテストしました。その結果、高額なコストをかけずに素晴らしい結果を得る方法を見つけました。
以下は、私が見つけた価格比較です:
• DeepSeek V4 Flash: 入力 $0.27 / 出力 $1.10 • DeepSeek V4 Pro: 入力 $0.55 / 出力 $2.20 • Qwen3-32B: 入力 $0.30 / 出力 $1.20 • GLM-4 Plus: 入力 $0.20 / 出力 $0.80 • GPT-4o: 入力 $2.50 / 出力 $10.00
私はGlobal APIに切り替えました。これを使うと、1つのエンドポイントから184種類の異なるモデルにアクセスできます。
サポートボットにはDeepSeek V4 Flashを選びました。GPT-4oよりもはるかに安価です。テクニカルサポートのタスクにおいては、GPT-4oの約84.6%の性能を備えています。ほとんどのユーザーは、単純な質問に対して単純な回答を求めているだけなのです。
コストを下げるために、主に3つの戦略を用いました:
- Caching(キャッシュ): Redisを使用して、よくある回答を保存しています。ユーザーは同じ質問をすることがよくあります。キャッシュヒット率を40%にすることで、請求額を30%削減できました。
- Streaming(ストリーミング): ストリーミングを有効にして、言葉が一つずつ表示されるようにしました。これにより、ユーザーにとってボットの反応が速く感じられます。
- Right-sizing(適切なモデルの選択): 簡単なタスクにはより安価なモデルを使用します。パスワードのリセット方法を説明するのに、天才的なモデルは必要ありません。
私の結果: 最適化前は、月額45ドルかかっていました。 現在は、月額18ドルです。 これは、コストの60%削減にあたります。
AIツール構築へのアドバイス:
- 同じ回答に対して二度支払うことを避けるため、積極的にキャッシュを活用する。
- ユーザー体験を向上させるために、レスポンスをストリーミングする。
- 業務を十分に遂行できる範囲内で、最も安価なモデルを選択する。
- 「高評価/低評価」ボタンを使用して品質を監視する。
- メインのプロバイダーがダウンした場合に備えて、フォールバックモデルを使用する。
Source: https://dev.to/fiercedash/how-i-built-a-wordpress-ai-chatbot-without-going-broke-in-2026-4mmn