构建和扩展印尼本地语言的低资源和代表性平行数据集

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该论文介绍了为印度东北地区的十三种资源匮乏的语言创建双语语料库,并提供了初步翻译结果。计划将这些语料库扩展到包括更多印度语言,并创建全球范围的语料库。

🎯

关键要点

  • 为印度东北地区的十三种资源匮乏的语言创建初始的双语语料库。
  • 提供了这些语言的初步翻译结果。
  • 创建了这些语言的首个平行语料库。
  • 提供了关于这些语言的基准神经机器翻译结果。
  • 计划将语料库扩展到包括更多资源匮乏的印度语言。
  • 结合之前在非洲和美洲印第安语言方面的工作,创建全球范围的语料库。
➡️

继续阅读