BSS-CFFMA:基于自监督嵌入的跨域特征融合与多注意力语音增强网络

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的语音增强框架HFSDA,融合了异构空间特征和双维注意力机制,以提高嘈杂环境中的语音清晰度和质量。实验证明该框架在VCTK-DEMAND数据集上的表现与现有模型相当,验证了其有效性。

🎯

关键要点

  • 本研究提出了一种新的语音增强框架HFSDA。
  • HFSDA融合了异构空间特征和双维注意力机制。
  • 该框架旨在提高嘈杂环境中的语音清晰度和质量。
  • 模型结合自监督学习嵌入和短时傅里叶变换的特征。
  • 实验结果表明HFSDA在VCTK-DEMAND数据集上的表现与现有模型相当。
  • 验证了HFSDA方法的有效性。
➡️

继续阅读