基于频域自回归建模的语音增强

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文提出了一种基于自回归模型和双路径长短期记忆模型的语音去混响统一框架,能够显著提高语音质量和ASR性能。该方法在REVERB挑战数据集和VOiCES数据集上相较基线系统以及其他去混响基准方法显示出显著的性能改善,主观听测试进一步突显了音频还原质量的提升。

🎯

关键要点

  • 提出了一种基于自回归模型和双路径长短期记忆模型的语音去混响统一框架。
  • 该框架显著提高了语音质量和ASR性能。
  • 在REVERB挑战数据集和VOiCES数据集上,相较基线系统和其他去混响基准方法显示出显著的性能改善。
  • 基线系统上相对提升率为10-24%。
  • 主观听测试进一步突显了音频还原质量的提升。
➡️

继续阅读