最大的开源GraphRag:知识图谱完全自主构建|港科大&华为

💡 原文中文,约4900字,阅读约需12分钟。
📝

内容提要

香港科技大学与华为联合开发的AutoSchemaKG框架能够自动构建知识图谱,无需预定义模式。该系统利用大型语言模型从文本中提取知识三元组并进行模式归纳,构建了包含9亿节点的ATLAS知识图谱。实验结果显示其提取精度高、信息保留度强,适应性良好,推动了知识图谱的自动化发展。

🎯

关键要点

  • 香港科技大学与华为联合开发的AutoSchemaKG框架能够自动构建知识图谱,无需预定义模式。
  • 该系统利用大型语言模型从文本中提取知识三元组并进行模式归纳,构建了包含9亿节点的ATLAS知识图谱。
  • 实验结果显示AutoSchemaKG在提取精度和信息保留度方面表现优异,适应性良好。
  • AutoSchemaKG通过多阶段流水线提取三元组,支持实体-实体、实体-事件和事件-事件关系的识别。
  • 模式归纳过程将特定的实体、事件和关系抽象为通用类型,增强了知识图谱的适应性。
  • ATLAS知识图谱的构建使用了大量文档,计算需求巨大,涉及数万小时的GPU计算。
  • 评估显示AutoSchemaKG在三元组提取的精确率、召回率和F1分数均超过90%。
  • 在多跳问答任务中,AutoSchemaKG表现出色,优于传统检索方法。
  • ATLAS知识图谱在不同领域的知识能力表现优异,特别是在医学、法律和社会科学领域。
➡️

继续阅读