遵循指示语音识别
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究比较了不同的端到端模型在长篇转录上的性能,证明了RNN-T模型比注意力模型更加鲁棒,并提出了两种改进方法,使得注意力模型的性能得到了极大提升,达到了和RNN-T模型相当的水平。
🎯
关键要点
- 本研究调查和提高端到端模型在长篇转录上的性能。
- 实验比较了不同的端到端模型。
- RNN-T 模型在长篇转录场景下比注意力模型更加鲁棒。
- 提出了限制注意力单调性和分段解码算法两种改进方法。
- 改进后的注意力模型性能极大提升,达到了与 RNN-T 模型相当的水平。
➡️