自动语音识别中的持续学习新词

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

基于自我监督的持续学习方法在自动语音识别系统中识别新词时表现出增长性能。通过使用增强型记忆自动语音识别模型,对滑动中的新词进行解码,并对检测到的新词使用推理,将包含这些新词的话语收集到自适应数据集中,对该集进行持续学习。该方法在新词经常出现时获得递增性能,同时保持模型的一般性能。

🎯

关键要点

  • 基于自我监督的持续学习方法在自动语音识别系统中识别新词时表现出增长性能。
  • 使用增强型记忆自动语音识别模型对滑动中的新词进行解码。
  • 对检测到的新词使用推理,将包含这些新词的话语收集到自适应数据集中。
  • 对自适应数据集进行持续学习,通过调整模型的权重矩阵。
  • 该方法在新词经常出现时获得递增性能,召回率超过80%。
  • 同时保持模型的一般性能。
➡️

继续阅读