该研究提出了一种改善语音质量和ASR性能的语音去混响方法,通过自回归模型分离语音信号的包络和载波部分,并使用基于DPLSTM模型的神经网络结构进行优化。实验结果显示,该方法在数据集上相较基线系统和其他方法有显著的性能改善。
该文提出了一种基于自回归模型和双路径长短期记忆模型的语音去混响统一框架,能够显著提高语音质量和ASR性能。该方法在REVERB挑战数据集和VOiCES数据集上相较基线系统以及其他去混响基准方法显示出显著的性能改善,主观听测试进一步突显了音频还原质量的提升。
完成下面两步后,将自动完成登录并继续当前操作。