本研究探讨了尼日利亚低资源语言(豪萨语、约鲁巴语和伊博语)在计算语言学中的资源不足问题。尽管相关文献增多,只有约25.1%的研究提供了新资源,强调了生成新资源的必要性。
本研究系统综述了2014至2024年间105项关于约鲁巴语自然语言处理的研究,指出数据标注短缺和模型可用性不足是主要障碍,为推动约鲁巴语及其他非洲语言的NLP发展提供了重要基础。
本研究提供了一个英语-约鲁巴语的评估数据集,旨在弥补高资源语言与低资源语言之间的评估差距。结果表明,约鲁巴语在自动评估中明显落后于英语,尤其在长文本理解方面,反映出英语大型语言模型在约鲁巴语阅读理解上的局限性。
完成下面两步后,将自动完成登录并继续当前操作。