增强印尼自动语音识别:评估具有多样语音变异性的多语言模型
📝
内容提要
本研究解决了印尼自动语音识别模型在多样语音特征下的转录准确性不足的问题。通过构建包含多样语音变异性的印尼数据集,并评估最先进的MMS和Whisper模型,发现Whisper微调模型在不同语音变异组中的表现最佳,显著降低了字错误率(WER)和字符错误率(CER)。研究还表明,发音风格的变化对模型性能的影响最大。
➡️
本研究解决了印尼自动语音识别模型在多样语音特征下的转录准确性不足的问题。通过构建包含多样语音变异性的印尼数据集,并评估最先进的MMS和Whisper模型,发现Whisper微调模型在不同语音变异组中的表现最佳,显著降低了字错误率(WER)和字符错误率(CER)。研究还表明,发音风格的变化对模型性能的影响最大。