XCB:一种有效的上下文偏倚方法,用于语音识别中的跨语言短语偏倚

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该研究提出了一种轻量级字符表示的方法,用于编码精细的发音特征,并结合预训练的神经语言模型,以提高基于声学相似性的情境偏倚。实验结果表明,该方法在不同情境偏见列表大小上相对于基线模型提高了4.62%-9.26%的WER。在稀有单词和内部测试集上,相对WER的提高分别为36.80%和23.40%。

🎯

关键要点

  • 研究提出了一种轻量级字符表示的方法,用于编码精细的发音特征。
  • 该方法结合预训练的神经语言模型,以提高基于声学相似性的情境偏倚。
  • 在Librispeech数据集上,采用该方法的Conformer Transducer模型相对WER提高了4.62%-9.26%。
  • 在大规模内部数据集上,相对WER的提高为7.91%。
  • 在稀有单词和内部测试集上,分别实现了36.80%和23.40%的相对WER改善。
➡️

继续阅读