在阿拉伯电话领域中评估自动语音识别系统的新基准
原文中文,约300字,阅读约需1分钟。发表于: 。该研究旨在介绍一个全面的阿拉伯语语音识别基准,专门针对阿拉伯语电话对话的挑战。通过使用多样化的方言表达并考虑电话录音的质量变化,该基准旨在为开发和评估在电话环境中处理阿拉伯语言复杂性的自动语音识别系统提供严格的测试平台,并尝试使用最先进的 ASR 技术建立基准性能评估。
本文通过多阶段增强方法改进阿拉伯语言障碍患者的自动语音识别性能。使用基于信号的方法生成阿拉伯语言障碍患者的语音,并通过对英语语言障碍患者语音数据进行训练以进行多语言扩充。实验结果显示,相比只针对健康数据训练的基础模型,本文方法在阿拉伯语言障碍患者的语音数据集上实现了18%的词错误率和17.2%的字符错误率的提升,并在真实的英文语言障碍患者语音数据集上实现了124%的词错误率的提升。