评估基于学习的语音增强系统在嘈杂和混响环境中的泛化差距
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该文介绍了一个改进的训练框架,用于训练单声道神经增强模型,提高鲁棒语音识别性能。该框架利用混合不变训练准则,扩展了未配对的干净语音和真实嘈杂数据,提高了从真实嘈杂语音中分离出来的语音质量,并通过处理和未处理信号的混合来缓解处理伪影。实验证明,该方法在单通道 CHiME-3 真实测试集上相对 WER 减少了 16% 到 39%。
🎯
关键要点
- 提出了一个改进的训练框架,用于训练单声道神经增强模型。
- 该框架利用混合不变训练准则,扩展了未配对的干净语音和真实嘈杂数据。
- 提高了从真实嘈杂语音中分离出来的语音质量。
- 通过处理和未处理信号的混合来缓解处理伪影。
- 在单通道 CHiME-3 真实测试集上,方法相对 WER 减少了 16% 到 39%。
➡️