CR-CTC:用于改进语音识别的一致性正则化CTC

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文介绍了一种改进CTC模型的方法,通过利用标签先验知识减少路径中的空白对齐得分,从而提升训练效果。在Buckeye和TIMIT数据集上,该方法的音素和词边界错误率降低了12-40%。与MFA相比,Buckeye表现相似,TIMIT稍逊,但训练流程更简单高效。相关训练步骤和预训练模型已在TorchAudio发布。

原文中文,约400字,阅读约需1分钟。
阅读原文