跨模态伪标签半监督音频 - 视觉源定位
原文中文,约300字,阅读约需1分钟。发表于: 。我们的研究聚焦于半监督 AVSL 中的伪标签方法,提出了一种名为 Cross Pseudo-Labeling(XPL)的新方法,通过交互学习和交叉精炼机制,避免偏见积累,并结合软伪标签和课程数据选择模块以实现稳定训练,实验证明 XPL 相较于现有方法在性能上显著优越,并在保持稳定性的同时有效减轻了确认偏见。
本文介绍了一种名为Cross Pseudo-Labeling(XPL)的新方法,用于半监督AVSL中的伪标签方法。XPL通过交互学习和交叉精炼机制避免了偏见积累,并结合软伪标签和课程数据选择模块以实现稳定训练。实验证明XPL在性能上优于现有方法,并减轻了确认偏见。