低资源自动语音识别的方言适应和数据增强:MADASR 2023 挑战中的 TalTech 系统
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了一种跨语言转移学习方法,使用无标签语音数据集和自我训练来提高单语言 wav2vec-2.0 模型的自动语音识别性能。经过调整后,该模型在目标语言 ASR 任务上表现类似于训练了 53 种语言的顶级多语言 XLSR 模型。
🎯
关键要点
- 该研究提出了一种跨语言转移学习方法。
- 方法适用于资源匮乏语言的单语言 wav2vec-2.0 模型的自动语音识别(ASR)。
- 使用目标语言中的无标签语音数据集和自我训练来提高性能。
- 调整后的模型在目标语言 ASR 任务上表现类似于顶级多语言 XLSR 模型。
🏷️
标签
➡️