💡
原文中文,约1400字,阅读约需4分钟。
📝
内容提要
RAG应用通过将信息存为向量,与查询匹配后传给大语言模型。切分策略包括固定大小、语义、递归、文档结构和基于LLM的切分。固定大小简单但可能破坏语义,语义切分流畅但需设阈值,递归灵活但复杂,文档结构完整但长度不一,LLM切分准确但成本高。选择需考虑内容、模型能力和资源。
🎯
关键要点
- RAG应用通过将信息存为向量,与查询匹配后传给大语言模型(LLM)。
- 切分操作将大文档分割成较小部分,以适应嵌入模型的输入大小,提高检索效率和准确性。
- 固定大小切分易于实现,但可能破坏语义流畅性,重要信息可能分散。
- 语义切分根据有意义的单元切分文档,保持语言流畅性,提高检索准确度。
- 递归切分基于内在分隔符进行切分,保持语言流畅性,但实现复杂性较高。
- 基于文档结构的切分利用文档内在结构定义切片边界,保持结构完整性,但切片长度可能不一。
- 基于LLM的切分通过提示词生成语义隔离的切片,确保高语义准确性,但计算成本最高。
- 选择切分策略需考虑内容性质、嵌入模型能力和计算资源。
➡️