阿拉伯方言识别审视:单标签分类的局限性
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文研究使用不同方法进行阿拉伯语方言识别,使用多类支持向量机综合这些特征,在阿拉伯语/英语语言识别任务中获得100%的准确率。研究释放了数据作为方言识别的标准语料库。
🎯
关键要点
- 研究使用语音识别系统获得的音位、词汇特征和声学特征进行阿拉伯语方言识别。
- 采用多类支持向量机(SVM)综合特征,在阿拉伯语/英语语言识别任务中获得100%的准确率。
- 使用特征作为二元分类器区分现代标准阿拉伯语(MSA)和方言阿拉伯语,获得100%的准确率。
- 进一步区分五种广泛使用的阿拉伯语方言,准确率为52%。
- 讨论方言识别中的错误及语言代码切换的上下文中的错误模式。
- 释放研究中使用的数据作为方言识别的标准语料库。
➡️