我为我的本地 RAG 添加了一个验证层以检测幻觉

Translated for your language. 阅读原文.

AI-assisted draft.

GyaanSetu Editorial3天前2分钟阅读

我为我的本地 RAG 添加了一个验证层，以捕捉幻觉

我使用 Ollama 构建了一个本地研究助手。它运行在我的个人论文上。没有任何数据离开我的机器。

我想阻止幻觉。一个语气肯定却引用错误数字的工具是危险的。

我添加了一个验证层。它分为三个步骤：

测试结果给了我一个深刻的教训。我在自己的数据上犯了两次错误。

首先，模型给出了一个真实的数字，但使用了错误的上下文。它为一个并不存在的测试集引用了 0.804 的 AUROC。数字是真的，但上下文是编造的。由于数字匹配，我的验证器通过了它。

其次，模型从论文的其他部分抓取了一个数字。它将一个数值归因于错误的实验。

以下是我通过测试学到的经验：

你需要基准真相 (ground truth)。如果不了解真实答案，就无法衡量幻觉。我差点在关于自己工作的研究中发表了两个错误的发现。通过对文件进行简单的搜索，这两个错误都得到了修正。

给你的 RAG 的实用建议：

继续阅读