通过弱监督音素为基础的多语言预训练,实现对瑶族苗语的低资源语音识别

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了对中国瑶族主要民族语言之一的苗语进行低资源语音识别的方法。比较了基于音素、子词和自监督预训练的三种方法,结果显示音素监督效果最好,数据效率更高。弱监督的基于音素的多语言预训练模型(Whistle 模型)取得了最具竞争力的结果。

🎯

关键要点

  • 研究了对中国瑶族主要民族语言之一的苗语进行低资源语音识别的方法。
  • 比较了基于音素、子词和自监督预训练的三种方法。
  • 实验结果表明音素监督效果最好,数据效率更高。
  • 弱监督的基于音素的多语言预训练模型(Whistle 模型)取得了最具竞争力的结果。
➡️

继续阅读