Docs2KG: 基于大型语言模型辅助的异构文档统一知识图谱构建
原文中文,约300字,阅读约需1分钟。发表于: 。本文介绍了 Docs2KG,一种从不同和异构的非结构化文档中提取多模式信息的新框架。Docs2KG 可以动态生成表示提取的关键信息的统一知识图,从而实现对文档数据湖的高效查询和探索。该框架与现有方法不同,它提供了一种灵活可扩展的解决方案,可以适应各种文档结构和内容类型。Docs2KG 通过统一的数据处理支持多种下游任务,提高了领域解释能力。
这篇综述审查了300多篇文章,重点关注了KG驱动的多模式学习和多模式知识图谱的研究进展。讨论了KG驱动的多模式学习任务和MMKG任务,并提供了定义、评估基准和关键见解。最后讨论了当前的挑战和新兴趋势,如大型语言模型和多模式预训练策略的进展。旨在为KG和多模式学习研究提供参考和洞察力。