小红花·文摘

该研究使用深度学习模型进行了基于掩蔽的语音信号增强和分离任务的研究，并比较了不同的分析合成基础和网络结构。研究结果表明，短时傅立叶变换在通用声音分离方面表现优异，而长窗口的STFT在语音/非语音分离方面效果更好。作者的改进方法在分离性能上取得了显著提高。