RAG应用通过将信息存为向量,与查询匹配后传给大语言模型。切分策略包括固定大小、语义、递归、文档结构和基于LLM的切分。固定大小简单但可能破坏语义,语义切分流畅但需设阈值,递归灵活但复杂,文档结构完整但长度不一,LLM切分准确但成本高。选择需考虑内容、模型能力和资源。
完成下面两步后,将自动完成登录并继续当前操作。