低资源自动语音识别的方言适应和数据增强:MADASR 2023 挑战中的 TalTech 系统

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提出了一种跨语言转移学习方法,使用无标签语音数据集和自我训练来提高单语言 wav2vec-2.0 模型的自动语音识别性能。经过调整后,该模型在目标语言 ASR 任务上表现类似于训练了 53 种语言的顶级多语言 XLSR 模型。

🎯

关键要点

  • 该研究提出了一种跨语言转移学习方法。
  • 方法适用于资源匮乏语言的单语言 wav2vec-2.0 模型的自动语音识别(ASR)。
  • 使用目标语言中的无标签语音数据集和自我训练来提高性能。
  • 调整后的模型在目标语言 ASR 任务上表现类似于顶级多语言 XLSR 模型。
➡️

继续阅读