量子位 ·

最大的开源GraphRag：知识图谱完全自主构建｜港科大＆华为

💡 原文中文，约4900字，阅读约需12分钟。

📝

内容提要

香港科技大学与华为联合开发的AutoSchemaKG框架能够自动构建知识图谱，无需预定义模式。该系统利用大型语言模型从文本中提取知识三元组并进行模式归纳，构建了包含9亿节点的ATLAS知识图谱。实验结果显示其提取精度高、信息保留度强，适应性良好，推动了知识图谱的自动化发展。

🎯

🔎

AutoSchemaKG框架的推出标志着知识图谱构建的重大进步。通过无需预定义模式的方式，该系统能够快速适应不同领域的需求，提升了知识图谱的可扩展性和灵活性。这种自动化不仅减少了人工干预的需求，还能在短时间内处理海量数据，极大地提高了构建效率。

ATLAS知识图谱在医学、法律和社会科学等领域表现优异，显示出其广泛的应用潜力。尤其是在处理复杂的多跳问答任务时，AutoSchemaKG的表现超越了传统方法，表明其在知识检索和推理方面的强大能力。这为未来在专业领域的知识管理和信息检索提供了新的思路。

构建ATLAS知识图谱需要巨大的计算资源，涉及数万小时的GPU计算。这一高昂的计算需求可能限制了小型机构或初创企业的参与。因此，如何优化计算效率和降低成本，将是未来推广和应用AutoSchemaKG框架的重要课题。

❓

AutoSchemaKG框架能够自动构建知识图谱，无需预定义模式，利用大型语言模型从文本中提取知识三元组并进行模式归纳。

ATLAS知识图谱包含超过9亿节点和59亿边。

AutoSchemaKG在三元组提取的精确率、召回率和F1分数均超过90%。

AutoSchemaKG通过概念化过程将特定实体、事件和关系抽象为通用类型，建立语义桥梁，支持跨领域的零样本推理。

ATLAS知识图谱在医学、法律和社会科学领域表现优异，特别是在医学和社会科学领域的知识能力突出。

构建ATLAS知识图谱的计算需求巨大，涉及数万小时的GPU计算。

🏷️