Fatescript ·

当我谈RAG时我谈些什么

💡 原文中文，约8600字，阅读约需21分钟。

📝

内容提要

RAG（检索增强生成）技术通过搜索引擎提供材料，帮助模型回答问题。相关信息的提供能显著提高回答的准确性，而错误信息则可能导致错误回答。RAG的作用在于帮助模型回忆正确答案，尤其在处理长尾知识时。

🎯

🔎

RAG技术在处理模型缺乏的知识时，能够通过搜索引擎提供相关信息，帮助模型生成更准确的回答。然而，当模型已有知识但学习效果不佳时，RAG的效果可能会受到限制。理解这两种场景的区别，有助于更好地利用RAG技术提升模型的回答质量。

模型生成回答的过程是基于概率的采样，这意味着即使模型具备正确的知识，采样偏差也可能导致错误的回答。因此，关注关键token的概率分布，可以帮助识别和修正模型的回答错误，从而提高整体回答的准确性。

在RAG的测试中，提供相关信息显著提高了模型的回答准确性。即使是看似无关的信息，也可能在一定程度上影响模型的信心。因此，在设计问题时，选择合适的上下文信息至关重要，这可以帮助模型更好地“回想”正确答案。

❓

RAG技术通过搜索引擎提供材料，帮助模型回答问题，显著提高回答的准确性。

RAG技术可以通过搜索引擎提供相关信息，帮助模型回忆正确答案，从而改善对已有知识的理解。

第一轮测试显示模型对已知信息的回答准确性较高，第二轮测试表明提供相关信息显著提高回答准确性，第三轮测试则显示模型能识别反事实信息。

RAG技术能够通过搜索引擎提供材料，帮助模型更好地回答长尾知识问题，弥补模型在预训练阶段的不足。

提供相关信息可以显著提高模型的回答准确性，而错误信息则可能导致错误回答。

模型的生成过程是概率的采样过程，采样偏差可能导致模型生成错误的回答。

🏷️