𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

📅2 hours ago⏱1 min read

ハイブリッド検索とエージェントのオブザーバビリティ

ほとんどのRAGシステムは、本番環境で失敗します。それは言語モデルのせいではありません。検索（retrieval）の段階で失敗しているのです。

システムが適切なデータチャンクを取得できないか、あるいはデータを取得できても、ランク40といった深い位置に埋もれてしまいます。その結果、ジェネレーターはその情報に決して辿り着けません。また、チーム側には何が問題だったのかを確認する方法もありません。

このアーキテクチャは、これら両方の問題を解決します。

より良い結果を得るために、次の3つのステップに従ってください：

ハイブリッド検索（Hybrid Retrieval）を使用する 語彙ベースのBM25と高密度なセマンティック検索（dense semantic search）を同時に実行します。Reciprocal Rank Fusionを使用してリストを統合してください。ベンチマークによると、テキストおよびテーブルデータにおいて、BM25単体と比較してRecall@5が8パーセントポイント向上することが示されています。
リランカー（Reranker）を追加する リランカーは、精度（precision）を高めるための最善の方法です。上位50〜100個の候補に対してクロスエンコーダー（cross-encoder）を使用してください。このステップにより、結果が大幅に改善されます。
オブザーバビリティ（Observability）に注力する 検索パイプライン内のエラーを特定するには、トレース（traces）が必要です。トレースがなければ、システムを修正することはできません。

これらの本番環境基準を用いて、RAGシステムを構築してください。

オプションの学習コミュニティ: https://t.me/GyaanSetuAi

Continue reading