CheapNET: 通过投影损失函数改进轻量级语音增强网络

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了对RNN的训练的多个方面,关注增强语音频谱的RNN,提出了两种学习目标,并通过客观质量和可懂度指标进行评估。研究了特征归一化和批次序列长度对增强语音质量的影响,并展示了所提出方法和最先进的实时RNN方法的主观评分。

🎯

关键要点

  • 本文研究了RNN(循环神经网络)训练的多个方面,影响实时单通道语音增强的质量。

  • 关注增强短时语音频谱的RNN,采用单帧输入单帧输出的框架。

  • 提出两种基于均方误差的学习目标,分别控制音频失真和噪声降低的重要性。

  • 通过客观质量和可懂度指标评估所提出的方法,并与其他竞争性在线方法进行比较。

  • 研究特征归一化和批次序列长度对增强语音的客观质量的影响。

  • 展示所提出的方法与最先进的实时RNN方法的主观评分。

➡️

继续阅读