本研究提出了一种利用大型语言模型的检索增强生成框架,结合语言学输入和小型网络的可训练性,提升了低资源语言形态学注释任务的性能,尤其在数据稀缺环境下效果显著。
该论文介绍了Nabra,一个带有形态学注释的叙利亚阿拉伯方言语料库,由叙利亚本土人收集了超过6,000个句子构建,涵盖了多种叙利亚当地方言。九名注释员对这60,000个标记进行了全面的形态学注释,质量出色。该语料库是开源的,可在Currasat门户上公开使用。
完成下面两步后,将自动完成登录并继续当前操作。