本文研究了对中国瑶族主要民族语言之一的苗语进行低资源语音识别的方法。比较了基于音素、子词和自监督预训练的三种方法,结果显示音素监督效果最好,数据效率更高。弱监督的基于音素的多语言预训练模型(Whistle 模型)取得了最具竞争力的结果。
完成下面两步后,将自动完成登录并继续当前操作。