使用多个 softmax 上的注意力的流式双语端到端自动语音识别模型
原文中文,约300字,阅读约需1分钟。发表于: 。本文介绍了一种新颖的双语端到端模型,通过共享编码器和预测网络,并通过自注意机制组合语言特定的联合网络,实现了单一神经模型对多种语言的识别和支持语言之间的动态切换,相比传统双语基线模型,该方法在印地语、英语和混合代码测试集上分别降低了 13.3%、8.23% 和 1.3% 的词误差率。
本文介绍了一种新颖的双语端到端模型,通过共享编码器和预测网络,并通过自注意机制组合语言特定的联合网络,实现了单一神经模型对多种语言的识别和支持语言之间的动态切换。该方法在印地语、英语和混合代码测试集上分别降低了13.3%、8.23%和1.3%的词误差率。