微调 vs RAG：教会 LLM 的两种方式

Translated for your language. 阅读原文.

AI-assisted draft.

微调 vs RAG：教导 LLM 的两种方式

你希望 LLM 了解你的私有文档或最新新闻。你有两个选择：RAG 或微调。人们经常选错。

规则很简单。用 RAG 处理事实，用微调处理行为。

RAG (Retrieval-Augmented Generation) 这就像是一场开卷考试。你将数据保存在模型之外。你检索相关信息并将其粘贴到提示词（prompt）中。

微调 (Fine-tuning) 这就像是内化一种新习惯。你通过特定的示例来训练模型。

如何选择：问问自己，你需要的是一个事实，还是一种行为方式。

如果需要更新以下内容，请使用 RAG：

如果需要以下内容，请使用微调：

最好的方法通常是两者结合。通过微调来决定模型如何回答，通过 RAG 来决定它使用哪些事实。一个客服机器人通过微调来使其语气专业，通过 RAG 来获取最新的帮助文章。

从提示工程（prompting）和 RAG 开始。只有在必须时才转向微调。

继续阅读