增加多语言知识图谱中文本信息的覆盖范围和精确度
原文中文,约500字,阅读约需2分钟。发表于: 。自然语言处理和计算机视觉领域中近期的研究一直在利用知识图谱中可用的文本信息,例如实体名称和描述,来将神经模型与高质量的结构化数据对接。然而,在非英语语言中,可用的文本信息的数量和质量相对较少。为了解决这个问题,我们提出了自动知识图谱增强(KGE)的新任务,并对英语和非英语语言之间的文本信息的数量和质量差异进行了深入研究。作为对增加多语言覆盖率和实体名称、描述精确度的问题的研究,我们呈现了...
该研究提出了自动知识图谱增强(KGE)的新任务,以解决非英语语言中可用文本信息的数量和质量较少的问题。研究呈现了一种新的无监督方法M-NTA,结合了机器翻译、网络搜索和大型语言模型,以生成高质量的文本信息。研究还探讨了增加非英语文本信息对实体链接、知识图谱补全和问题回答的影响。此外,研究还介绍了WikiKGE-10,一个跨7个语系评估10种语言中KGE方法的基准。