Maximum Likelihood Training for Transformer-based Streaming Speech Recognition

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究探讨了传统流式转导模型在训练与推理中的似然函数不匹配问题,提出了前向变量因果补偿(FoCC)方法。实验结果表明,FoCC在LibriSpeech数据集上显著提高了模型的识别准确性。

🎯

关键要点

  • 本研究探讨了传统流式转导模型在训练与推理中的似然函数不匹配问题。
  • 提出了前向变量因果补偿(FoCC)方法来量化实际似然与变形似然之间的差距。
  • 实验结果表明,FoCC在LibriSpeech数据集上显著提高了模型的识别准确性。
➡️

继续阅读