小红花·文摘

本研究提出了一种基于动态门控融合的音视频源分离方法，解决了音频与视觉特征融合中的信息丢失问题。该方法通过动态调整模态融合程度，增强音频特征表达能力，显著提升了模型性能，验证了其在音视频源分离任务中的有效性。