本研究针对历史文本中的实体链接挑战,特别是在音乐领域,提出了音乐遗产命名实体识别、分类和链接(MHERCL)新基准,并开发了一种结合知识图谱的无监督实体链接模型,显著提升了历史文献的实体链接性能。
本研究探讨了领域适应技术在历史文本处理中的应用,特别是在词性标注和文本规范化方面。通过深度学习模型和多任务学习,提升了模型性能。研究分析了不同语言的历史拼写规范化方法,强调了训练数据的重要性,并提出在规范化过程中需谨慎,以保留文本特性。
完成下面两步后,将自动完成登录并继续当前操作。