突尼斯阿拉伯语规范拼写

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该论文介绍了Nabra,一个带有形态学注释的叙利亚阿拉伯方言语料库,由叙利亚本土人收集了超过6,000个句子构建,涵盖了多种叙利亚当地方言。九名注释员对这60,000个标记进行了全面的形态学注释,质量出色。该语料库是开源的,可在Currasat门户上公开使用。

🎯

关键要点

  • 该论文介绍了Nabra,一个带有形态学注释的叙利亚阿拉伯方言语料库。
  • Nabra由叙利亚本土人收集了超过6000个句子,包含约60000个单词。
  • 语料库内容来源于社交媒体、电影剧本、歌曲歌词和当地谚语。
  • Nabra涵盖了多种叙利亚方言,包括阿勒颇、大马士革等地的方言。
  • 九名注释员对60000个标记进行了全面的形态学注释,确保了注释质量。
  • 注释员遵循方法论注释指南,确保唯一的语素注释和规范化处理。
  • F1和kappa一致性得分在74%到98%之间,显示注释质量出色。
  • Nabra语料库是开源的,并在Currasat门户上公开可用。
➡️

继续阅读