RAG(检索增强生成)分为离线和在线两个阶段。离线阶段包括文档解析、数据清洗和分块,在线阶段涉及用户提问、检索和生成回答。文档解析需兼容多种格式,数据清洗去除冗余信息,分块策略保持语义完整,向量化用于生成嵌入。检索阶段结合稠密和稀疏向量,重排序提升答案相关性。评估指标包括召回率、正确度和知识回答的准确性。
完成下面两步后,将自动完成登录并继续当前操作。