BSS-CFFMA:基于自监督嵌入的跨域特征融合与多注意力语音增强网络
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的语音增强框架HFSDA,融合了异构空间特征和双维注意力机制,以提高嘈杂环境中的语音清晰度和质量。实验证明该框架在VCTK-DEMAND数据集上的表现与现有模型相当,验证了其有效性。
🎯
关键要点
- 本研究提出了一种新的语音增强框架HFSDA。
- HFSDA融合了异构空间特征和双维注意力机制。
- 该框架旨在提高嘈杂环境中的语音清晰度和质量。
- 模型结合自监督学习嵌入和短时傅里叶变换的特征。
- 实验结果表明HFSDA在VCTK-DEMAND数据集上的表现与现有模型相当。
- 验证了HFSDA方法的有效性。
🏷️
标签
➡️