本研究提出了一种基于动态门控融合的音视频源分离方法,解决了音频与视觉特征融合中的信息丢失问题。该方法通过动态调整模态融合程度,增强音频特征表达能力,显著提升了模型性能,验证了其在音视频源分离任务中的有效性。
完成下面两步后,将自动完成登录并继续当前操作。