最大的开源GraphRag:知识图谱完全自主构建|港科大&华为
💡
原文中文,约4900字,阅读约需12分钟。
📝
内容提要
香港科技大学与华为联合开发的AutoSchemaKG框架能够自动构建知识图谱,无需预定义模式。该系统利用大型语言模型从文本中提取知识三元组并进行模式归纳,构建了包含9亿节点的ATLAS知识图谱。实验结果显示其提取精度高、信息保留度强,适应性良好,推动了知识图谱的自动化发展。
🎯
关键要点
- 香港科技大学与华为联合开发的AutoSchemaKG框架能够自动构建知识图谱,无需预定义模式。
- 该系统利用大型语言模型从文本中提取知识三元组并进行模式归纳,构建了包含9亿节点的ATLAS知识图谱。
- 实验结果显示AutoSchemaKG在提取精度和信息保留度方面表现优异,适应性良好。
- AutoSchemaKG通过多阶段流水线提取三元组,支持实体-实体、实体-事件和事件-事件关系的识别。
- 模式归纳过程将特定的实体、事件和关系抽象为通用类型,增强了知识图谱的适应性。
- ATLAS知识图谱的构建使用了大量文档,计算需求巨大,涉及数万小时的GPU计算。
- 评估显示AutoSchemaKG在三元组提取的精确率、召回率和F1分数均超过90%。
- 在多跳问答任务中,AutoSchemaKG表现出色,优于传统检索方法。
- ATLAS知识图谱在不同领域的知识能力表现优异,特别是在医学、法律和社会科学领域。
➡️