一种低资源语音识别的新型自训练方法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了自我训练在端到端语音识别中的应用,使用伪标签训练深度学习模型的方法,实验证明该方法可以显著提高准确率。通过语音和语言模型生成伪标签和序列到序列模型的过滤机制,并采用新颖的集成方法提高伪标签的多样性。实验结果显示,在噪声语音环境下,自我训练的集成模型相对于只使用100小时标记数据的基准模型,字错率提高了33.9%。在清晰语音环境下,自我训练可以弥补基准模型和理想模型之间的差距,提高了至少93.8%。
🎯
关键要点
-
自我训练在端到端语音识别中的应用
-
使用伪标签训练深度学习模型的方法
-
该方法显著提高基准模型的准确率
-
通过语音和语言模型生成伪标签
-
采用序列到序列模型的过滤机制
-
新颖的集成方法提高伪标签的多样性
-
在噪声语音环境下,自我训练的集成模型字错率提高33.9%
-
在清晰语音环境下,自我训练弥补基准模型和理想模型之间的差距,提高至少93.8%
➡️