遵循指示语音识别

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该研究比较了不同的端到端模型在长篇转录上的性能,证明了RNN-T模型比注意力模型更加鲁棒,并提出了两种改进方法,使得注意力模型的性能得到了极大提升,达到了和RNN-T模型相当的水平。

🎯

关键要点

  • 本研究调查和提高端到端模型在长篇转录上的性能。
  • 实验比较了不同的端到端模型。
  • RNN-T 模型在长篇转录场景下比注意力模型更加鲁棒。
  • 提出了限制注意力单调性和分段解码算法两种改进方法。
  • 改进后的注意力模型性能极大提升,达到了与 RNN-T 模型相当的水平。
➡️

继续阅读