使用多个 softmax 上的注意力的流式双语端到端自动语音识别模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新颖的双语端到端模型,通过共享编码器和预测网络,并通过自注意机制组合语言特定的联合网络,实现了单一神经模型对多种语言的识别和支持语言之间的动态切换。该方法在印地语、英语和混合代码测试集上分别降低了13.3%、8.23%和1.3%的词误差率。
🎯
关键要点
- 本文介绍了一种新颖的双语端到端模型。
- 该模型通过共享编码器和预测网络实现多种语言的识别。
- 使用自注意机制组合语言特定的联合网络。
- 支持语言之间的动态切换。
- 相比传统双语基线模型,该方法在印地语、英语和混合代码测试集上分别降低了13.3%、8.23%和1.3%的词误差率。
➡️