CheapNET: 通过投影损失函数改进轻量级语音增强网络
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究了对RNN的训练的多个方面,关注增强语音频谱的RNN,提出了两种学习目标,并通过客观质量和可懂度指标进行评估。研究了特征归一化和批次序列长度对增强语音质量的影响,并展示了所提出方法和最先进的实时RNN方法的主观评分。
🎯
关键要点
-
本文研究了RNN(循环神经网络)训练的多个方面,影响实时单通道语音增强的质量。
-
关注增强短时语音频谱的RNN,采用单帧输入单帧输出的框架。
-
提出两种基于均方误差的学习目标,分别控制音频失真和噪声降低的重要性。
-
通过客观质量和可懂度指标评估所提出的方法,并与其他竞争性在线方法进行比较。
-
研究特征归一化和批次序列长度对增强语音的客观质量的影响。
-
展示所提出的方法与最先进的实时RNN方法的主观评分。
➡️