本文介绍了一种改进CTC模型的方法,通过利用标签先验知识减少路径中的空白对齐得分,从而提升训练效果。在Buckeye和TIMIT数据集上,该方法的音素和词边界错误率降低了12-40%。与MFA相比,Buckeye表现相似,TIMIT稍逊,但训练流程更简单高效。相关训练步骤和预训练模型已在TorchAudio发布。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: