通过语音质量反馈进行到达方向校正
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了一种改善语音质量和ASR性能的语音去混响方法,通过自回归模型分离语音信号的包络和载波部分,并使用基于DPLSTM模型的神经网络结构进行优化。实验结果显示,该方法在数据集上相较基线系统和其他方法有显著的性能改善。
🎯
关键要点
- 提出了一种改善语音质量和ASR性能的语音去混响方法。
- 通过自回归模型分离语音信号的包络和载波部分。
- 设计了基于双路径长短期记忆(DPLSTM)模型的神经网络结构。
- 该方法在REVERB挑战数据集和VOiCES数据集上显示出显著的性能改善。
- 相较基线系统,该方法的相对提升率为10-24%。
- 主观听测试显示音频还原质量的提升。
➡️