该文介绍了一种新的多语言实体链接公式,使用面向语言不可知的知识库解析语言特定的提及。作者训练了一个双编码器,以获得单个实体检索模型,覆盖了100多种语言和2000万个实体。该模型在跨语言链接任务中表现优异,但仍面临着罕见实体和低资源语言的挑战。作者提出了一个新的大型多语言数据集Mewsli-9,以帮助增强模型和训练。
完成下面两步后,将自动完成登录并继续当前操作。