English-Thai-Sinhala Parallel Named Entity Annotation Corpus

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本文探讨了英、泰、僧三语并行语料库中低资源语言(僧伽罗语和泰米尔语)的命名实体标注问题,利用预训练的多语言模型建立了新的基准识别结果,展示了其在低资源神经机器翻译中的应用价值。

🎯

关键要点

  • 本文探讨了英、泰、僧三语并行语料库中低资源语言的命名实体标注问题。
  • 低资源语言包括僧伽罗语和泰米尔语。
  • 利用预训练的多语言模型建立了新的基准命名实体识别结果。
  • 展示了该NER系统在低资源神经机器翻译任务中的应用价值。
➡️

继续阅读