本研究探讨了自动语音识别(ASR)系统在非母语英语口音识别中的表现。评估结果显示,Whisper和AssemblyAI在朗读语音中表现最佳,而RevAI在自发语音中效果最佳。研究揭示了不同系统在流畅性处理上的差异,为语言教育者提供了参考。
本文研究了无监督文本到语音合成技术在改进口音语音识别中的应用。通过少量口音数据和伪标签生成合成语音,与无口音数据结合用于训练语音识别模型。实验表明,使用合成口音数据微调的Wav2vec2.0模型字错误率降低了6.1%。
完成下面两步后,将自动完成登录并继续当前操作。