本文介绍了CAFE,这是首个阿尔及利亚方言、法语和英语之间的代码切换数据集。该数据集通过捕捉自发对话中的代码切换,展示了高效数据处理技术对自动语音识别模型性能的显著提升。
本研究开发了FASSILA语料库,包含10,087个句子和19,497个词汇,旨在解决阿尔及利亚方言在假新闻检测和情感分析中的注释不足问题。通过高质量的标注和分类实验,取得了良好的效果。
完成下面两步后,将自动完成登录并继续当前操作。