场景感知音视频语音增强与选择状态空间模型
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新方法VC-S²E,利用同步视频中的上下文信息识别噪声类型,解决了语音增强中视觉信息利用不足的问题,实验结果表明其性能优于其他方法。
🎯
关键要点
- 本研究提出了一种新方法VC-S²E。
- 该方法利用同步视频中的上下文信息识别噪声类型。
- 解决了语音增强中视觉信息利用不足的问题。
- 特别针对遮挡或远摄环境下的语音增强。
- 首次利用同步视频的丰富上下文信息作为辅助线索。
- 显著提升了语音增强性能。
- 实验结果表明VC-S²E在多个公共数据集上的表现优于其他方法。
➡️