量子位 ·

GraphRAG太慢LightRAG延迟高？华东师大新方法一招破解双重难题

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

华东师大Planing Lab团队提出的E²GraphRAG方法显著提升了GraphRAG的索引速度和查询效率，构建时间为GraphRAG的1/10，查询时间为LightRAG的1/100，有效解决了现有RAG方法的效率问题。

🎯

🔎

E²GraphRAG方法通过结合实体识别和文档总结树，显著提升了索引和查询效率。这种创新不仅减少了对大模型的多次调用，还通过图和树的结合实现了信息的多层次提取，解决了传统RAG方法的局限性。

实验结果表明，E²GraphRAG在资源受限的情况下仍能保持良好表现，构建索引时间与查询时间均显著低于现有方法。这种效率与性能的平衡使得该方法在实际应用中更具可行性，尤其适用于大规模文档处理。

E²GraphRAG在处理文档token数量增加时，构建索引时间以最低斜率线性增长，显示出良好的扩展性。这意味着在面对更大规模的数据时，该方法依然能够高效运行，适合多种应用场景。

❓

E²GraphRAG方法在构建索引时间上是GraphRAG的1/10，查询时间是LightRAG的1/100，显著提升了索引速度和查询效率。

E²GraphRAG通过使用SpaCy进行实体识别，构建实体图和文档总结树，减少了对大模型的调用次数，从而提升了效率。

构建阶段包括文档分块和利用LLM递归总结文档树，结合SpaCy抽取实体图，形成不同粒度的信息结构。

实验结果显示，E²GraphRAG在资源受限情况下表现良好，达到了效率与性能的均衡。

E²GraphRAG根据问题内容自动选择local或global检索方式，利用构建的实体图和文档树进行高效检索。

E²GraphRAG的构建索引时间随着文档token数量以最低斜率线性增长，具备良好的扩展性。

🏷️