本研究探讨了尼日利亚低资源语言(豪萨语、约鲁巴语和伊博语)在计算语言学中的资源不足问题。尽管相关文献增多,只有约25.1%的研究提供了新资源,强调了生成新资源的必要性。
本研究使用Twitter数据创建了三种主要尼日利亚语言的侮辱性言论检测数据集,并使用预训练的语言模型评估了其有效性,准确率达到90%。计划公开数据集和模型。
完成下面两步后,将自动完成登录并继续当前操作。