DyPCL:针对构音障碍语音识别的动态音素级对比学习

📝

内容提要

本研究针对构音障碍语音识别中的表现下降问题,提出了一种动态音素级对比学习方法(DyPCL),以在不同说话者间获得不变的语音表征。通过将语音分解为音素段并引入动态课程学习,我们的方法能够更好地区分细微的语音差异,最终在UASpeech数据集上实现了22.10%的字错误率相对降低,显著提升了识别性能。

🏷️

标签

➡️

继续阅读