三点水 ·

关于 RAG 的一些碎碎念

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

检索增强生成（RAG）技术在大模型兴起后受到关注，但其局限性逐渐显现。RAG能够解决大模型的幻觉、知识更新和私有知识问题，流程包括索引、检索和生成。然而，缺乏整体视角可能导致回答不完整。为提升效果，可采用文档结构化和多路召回等方法。未来需探索更高效的知识表示和压缩方式，以改善RAG的应用效果。

🎯

🔎

尽管RAG技术在处理大模型的幻觉、知识更新和私有知识问题上表现出色，但其局限性也不容忽视。特别是在缺乏整体视角的情况下，RAG可能无法提供完整的答案。因此，在应用RAG时，用户应关注其适用场景，尤其是需要综合多文档信息的复杂问题。

文档结构化是提升RAG效果的关键手段之一。通过提取标题、目录等结构化信息，可以显著增加切片的信息量，从而提高检索的准确性。然而，文档结构化的实施难度较大，尤其是面对多种格式的文档时，如何有效提取信息仍需深入研究。

在RAG项目的落地过程中，人力资源的短缺是一个主要障碍。高质量的标注数据需要专业人员的支持，而许多企业在知识库建设和数据治理方面缺乏足够的资源。这使得RAG的实际应用面临挑战，企业需提前规划人力资源的投入。

❓

RAG技术能够解决大模型的幻觉、知识更新和私有知识问题。

RAG的基本流程包括索引、检索和生成三个部分。

RAG缺乏整体视角，可能导致回答不完整，且无法理解文档的语境。

可以通过文档结构化和多路召回与重排序等方法来提升检索效果。

RAG需要结合文档的meta信息来理解用户查询中的隐含结构化信息。

未来需要探索更高效的知识表示和压缩方式，以改善RAG的应用效果。

🏷️