基于混合注意力的编码器 - 解码器模型用于高效语言模型适应

原文约300字,阅读约需1分钟。发表于:

提出了一种新的混合注意力编码器 - 解码器(HAED)语音识别模型,通过分离声学模型和语言模型,以保留传统混合自动语音识别系统的模块化,实现了对传统基于文本的语言模型自适应技术的使用,从而在相对于纯 AED 模型在领域外文本数据进行语言模型自适应时实现了 21% 的词错误率(WER)改进,并且在一般测试集上只有微小的词错误率(WER)退化。

该文介绍了一种新的HAED语音识别模型,通过分离声学模型和语言模型,实现了对传统基于文本的语言模型自适应技术的使用,从而在领域外文本数据进行语言模型自适应时实现了21%的WER改进。

相关推荐 去reddit讨论