D4AM:用于下游声学模型的通用去噪框架
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究提出了通用降噪框架D4AM,用于改善嘈杂环境下声学模型性能。该框架通过反向梯度调整语音增强模型,考虑回归目标作为辅助损失,直接估计权重系数,避免额外训练成本。实验结果显示,相对于嘈杂输入,该框架在Google ASR API上相对WER降低24.65%,是首个实现回归和分类目标有效组合的通用预处理器。
🎯
关键要点
- 本研究提出了通用降噪框架D4AM,用于改善嘈杂环境下声学模型性能。
- D4AM通过反向梯度调整语音增强模型,考虑回归目标作为辅助损失。
- 该框架可以直接估计权重系数,避免额外训练成本。
- 实验结果显示,相对于嘈杂输入,该框架在Google ASR API上相对WER降低24.65%。
- D4AM是首个实现回归和分类目标有效组合的通用预处理器,适用于各种未知ASR系统。
➡️