𝗜 𝗔𝗱𝗱𝗲𝗱 𝗮 𝗩𝗲𝗿𝗶𝗳𝘆 𝗟𝗮𝘆𝗲𝗿 𝘁𝗼 𝗠𝘆 𝗟𝗼𝗰𝗮𝗹 𝗥𝗔𝗚 𝘁𝗼 𝗖𝗮𝘁𝗰𝗵 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝘀

Translated for your language. 原文を読む.

AI-assisted draft.

GyaanSetu Editorial3 日前2分で読めます

ハルシネーションを防ぐため、ローカルRAGに検証レイヤーを追加した

Ollamaを使用して、ローカルのリサーチアシスタントを構築しました。これは自分の論文に基づいて動作します。データがマシンから外部に出ることはありません。

ハルシネーション（もっともらしい嘘）を止めたいと考えました。自信満々な口調で誤った数値を引用するツールは危険です。

検証レイヤーを追加しました。これは3つのステップで動作します：

その結果、手痛い教訓を得ました。自分自身のデータについて、2回も間違えてしまったのです。

第一に、モデルは実在する数値を提示しましたが、文脈（コンテキスト）が間違っていました。存在しないテストセットに対して、AUROCが0.804であると引用したのです。数値自体は実在していましたが、文脈は嘘でした。検証器は、数字が一致していたため、これをパスさせてしまいました。

第二に、モデルが論文の別の部分から数値を拾ってきました。ある値を、誤った実験の結果として紐付けてしまったのです。

このテストから学んだことは以下の通りです：

検証は「値の欠如」しか検知できない。数値がテキスト内に全く存在しない場合は、検証器がそれを検知できます。しかし、数値自体は実在するものの、誤った事実に関連付けられている場合、検証は失敗することがよくあります。
同じモデルを判定役（ジャッジ）にすると盲点が生じる。回答を作成したモデルと同じモデルで回答を判定させると、自身のミスをそのまま承認（rubber-stamp）してしまいます。異なるモデルを判定に使用することで、誤った紐付けを検知しやすくなります。
フラグが常に「嘘」を意味するわけではない。フラグには3つの可能性があります：

グラウンドトゥルース（正解データ）が必要である。正解を知らなければ、ハルシネーションを測定することはできません。私は自分の研究について、2つの誤った知見を公表しそうになりました。ファイルを単純に検索し直すだけで、両方のエラーを修正できました。

RAGに関する実践的なアドバイス：

Optional learning community: https://t.me/GyaanSetuAi

続きを読む