场景感知音视频语音增强与选择状态空间模型

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新方法VC-S²E,利用同步视频中的上下文信息识别噪声类型,解决了语音增强中视觉信息利用不足的问题,实验结果表明其性能优于其他方法。

🎯

关键要点

  • 本研究提出了一种新方法VC-S²E。
  • 该方法利用同步视频中的上下文信息识别噪声类型。
  • 解决了语音增强中视觉信息利用不足的问题。
  • 特别针对遮挡或远摄环境下的语音增强。
  • 首次利用同步视频的丰富上下文信息作为辅助线索。
  • 显著提升了语音增强性能。
  • 实验结果表明VC-S²E在多个公共数据集上的表现优于其他方法。
➡️

继续阅读