突尼斯阿拉伯语规范拼写
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该论文介绍了Nabra,一个带有形态学注释的叙利亚阿拉伯方言语料库,由叙利亚本土人收集了超过6,000个句子构建,涵盖了多种叙利亚当地方言。九名注释员对这60,000个标记进行了全面的形态学注释,质量出色。该语料库是开源的,可在Currasat门户上公开使用。
🎯
关键要点
- 该论文介绍了Nabra,一个带有形态学注释的叙利亚阿拉伯方言语料库。
- Nabra由叙利亚本土人收集了超过6000个句子,包含约60000个单词。
- 语料库内容来源于社交媒体、电影剧本、歌曲歌词和当地谚语。
- Nabra涵盖了多种叙利亚方言,包括阿勒颇、大马士革等地的方言。
- 九名注释员对60000个标记进行了全面的形态学注释,确保了注释质量。
- 注释员遵循方法论注释指南,确保唯一的语素注释和规范化处理。
- F1和kappa一致性得分在74%到98%之间,显示注释质量出色。
- Nabra语料库是开源的,并在Currasat门户上公开可用。
➡️