𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗶𝗱𝗲
AIエージェントがハルシネーション(幻覚)を起こすのは、モデルが劣っているからではありません。アーキテクチャが過去のデータに固定されているからです。
ほとんどのRAGパイプラインは、古いデータに対する高価な応急処置に過ぎません。AWSは現在、その解決策を提供しています。Amazon Bedrock AgentCoreのWeb Searchです。これは、エージェントにライブウェブへのアクセス権を与えるマネージドツールです。
なぜこれが重要なのか:
LLMが知っていることと、ユーザーが尋ねることの間のギャップは日々拡大しています。このギャップが、エージェントをリスクを生む機械へと変えてしまうのです。
AgentCore Web Searchで得られるもの:
- ライブウェブの結果への構造化されたアクセス。
- カスタムクローラーが不要。
- サードパーティの検索API契約が不要。
- 個別の請求が発生しない。
- クローリング、ランキング、請求を単一のSDKコールで完結。
「ナレッジ凍結税(Knowledge Freeze Tax)」の支払いを止めましょう。これは、古いデータを使用することによって生じるコストです。誤った回答、エンジニアリング時間の浪費、そして高いレイテンシとして現れます。
本番環境グレードのパイプラインを構築する方法:
意図分類(Intent Classification):ルーターを使用して、クエリにライブウェブ、内部RAG、または構造化データが必要かどうかを判断します。すべてのクエリでウェブ検索を実行すると、予算を使い果たしてしまうため注意してください。
ウェブ検索の呼び出し(Web Search Invocation):ツールはタイトル、URL、スニペット、およびタイムスタンプを返します。
結果の合成(Result Synthesis):スニペットとタイムスタンプをモデルに注入します。ソースが古いかどうかをモデルが判断できるように、必ずタイムスタンプを含める必要があります。
オブザーバビリティ(Observability):Langfuseを使用して、どのウェブ検索結果が回答に影響を与えたかをトレースします。これはエンタープライズレベルのコンプライアンスにおいて不可欠です。
技術的なヒント:
- 素早い事実確認にはWeb Searchを使用してください。
- Browser Toolは、複雑なJavaScriptページやログインが必要なページにのみ使用してください。単純な検索にBrowser Toolを使用すると、3〜8秒のレイテンシが追加されます。
- IAM権限を確認してください。
bedrock-agentcore:InvokeWebSearch権限があることを確認してください。 - ハイブリッドアプローチを採用してください。外部データにはWeb Searchを、内部のプライベートドキュメントにはRAGを使用します。
目標はウェブ検索を最大限に使うことではありません。必要なときにのみウェブ検索を使用できる、十分にスマートなルーターを構築することです。
Optional learning community: https://t.me/GyaanSetuAi