XCB:一种有效的上下文偏倚方法,用于语音识别中的跨语言短语偏倚
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究提出了一种轻量级字符表示的方法,用于编码精细的发音特征,并结合预训练的神经语言模型,以提高基于声学相似性的情境偏倚。实验结果表明,该方法在不同情境偏见列表大小上相对于基线模型提高了4.62%-9.26%的WER。在稀有单词和内部测试集上,相对WER的提高分别为36.80%和23.40%。
🎯
关键要点
- 研究提出了一种轻量级字符表示的方法,用于编码精细的发音特征。
- 该方法结合预训练的神经语言模型,以提高基于声学相似性的情境偏倚。
- 在Librispeech数据集上,采用该方法的Conformer Transducer模型相对WER提高了4.62%-9.26%。
- 在大规模内部数据集上,相对WER的提高为7.91%。
- 在稀有单词和内部测试集上,分别实现了36.80%和23.40%的相对WER改善。
➡️