𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗶𝗱𝗲

AIエージェントがハルシネーション(幻覚)を起こすのは、モデルが劣っているからではありません。アーキテクチャが過去のデータに固定されているからです。

ほとんどのRAGパイプラインは、古いデータに対する高価な応急処置に過ぎません。AWSは現在、その解決策を提供しています。Amazon Bedrock AgentCoreのWeb Searchです。これは、エージェントにライブウェブへのアクセス権を与えるマネージドツールです。

なぜこれが重要なのか:

LLMが知っていることと、ユーザーが尋ねることの間のギャップは日々拡大しています。このギャップが、エージェントをリスクを生む機械へと変えてしまうのです。

AgentCore Web Searchで得られるもの:

  • ライブウェブの結果への構造化されたアクセス。
  • カスタムクローラーが不要。
  • サードパーティの検索API契約が不要。
  • 個別の請求が発生しない。
  • クローリング、ランキング、請求を単一のSDKコールで完結。

「ナレッジ凍結税(Knowledge Freeze Tax)」の支払いを止めましょう。これは、古いデータを使用することによって生じるコストです。誤った回答、エンジニアリング時間の浪費、そして高いレイテンシとして現れます。

本番環境グレードのパイプラインを構築する方法:

  1. 意図分類(Intent Classification):ルーターを使用して、クエリにライブウェブ、内部RAG、または構造化データが必要かどうかを判断します。すべてのクエリでウェブ検索を実行すると、予算を使い果たしてしまうため注意してください。

  2. ウェブ検索の呼び出し(Web Search Invocation):ツールはタイトル、URL、スニペット、およびタイムスタンプを返します。

  3. 結果の合成(Result Synthesis):スニペットとタイムスタンプをモデルに注入します。ソースが古いかどうかをモデルが判断できるように、必ずタイムスタンプを含める必要があります。

  4. オブザーバビリティ(Observability):Langfuseを使用して、どのウェブ検索結果が回答に影響を与えたかをトレースします。これはエンタープライズレベルのコンプライアンスにおいて不可欠です。

技術的なヒント:

  • 素早い事実確認にはWeb Searchを使用してください。
  • Browser Toolは、複雑なJavaScriptページやログインが必要なページにのみ使用してください。単純な検索にBrowser Toolを使用すると、3〜8秒のレイテンシが追加されます。
  • IAM権限を確認してください。bedrock-agentcore:InvokeWebSearch 権限があることを確認してください。
  • ハイブリッドアプローチを採用してください。外部データにはWeb Searchを、内部のプライベートドキュメントにはRAGを使用します。

目標はウェブ検索を最大限に使うことではありません。必要なときにのみウェブ検索を使用できる、十分にスマートなルーターを構築することです。

Source: https://dev.to/aarhamforensics_eb3c024eb/amazon-bedrock-agentcore-web-search-the-complete-production-guide-1jep

Optional learning community: https://t.me/GyaanSetuAi