别再问 LLM 它们的来源是否真实了

Translated for your language. 阅读原文.

AI-assisted draft.

GyaanSetu Editorial6天前2分钟阅读

不要再问 LLM 它们的来源是否真实了

你向 AI 请求一份来源列表。它给了你标题、作者和 DOI。一切看起来都很完美。然后你发现其中一半并不存在。

DOI 指向空无一物。那篇论文根本从未写过。

你的直觉是问模型：“你确定这是真实的吗？” AI 会说“是的”。它总是说“是的”。你这就像是在问一个伪造者他的作品是否真实。

LLM 并不使用论文数据库。它只是在预测序列中的下一个词。对于 AI 来说，引用仅仅是一种模式。它知道一个引用需要姓名、年份和十位数字。它模仿了真实来源的形式，却并不包含事实真相。

不要再让模型去验证它自己的工作了。它做不到，原因有二：

你必须使用外部工具来验证信息。以下是针对技术写作的三步过滤法：

这不仅仅适用于学术论文。如果 AI 引用了 JIRA 工单、CVE 编号或代码提交（code commit），你必须对照实际系统进行验证。

AI 架构中最大的错误就是信任模型进行自我验证。验证必须是一个独立的步骤。在用户看到结果之前，它必须连接到外部的事实来源（source of truth）。

不要试图让模型变得更诚实。它们是文本生成器，并且总会产生幻觉（hallucinate）。相反，不要再轻信它们的话。

一个无法通过注册表验证的引用并不是引用。它只是一个穿着实验服的猜测。

Optional learning community: https://t.me/GyaanSetuAi

继续阅读