应对测试时自鸣镜视频中的缺失模态
原文中文,约400字,阅读约需1分钟。发表于: 。通过测试时间自适应的方式,本研究提出了一种用于处理缺失模态的自监督在线解决方案,称为 MiDl(具有自我蒸馏的互信息)。通过最小化预测和可用模态之间的互信息,该方法鼓励模型对测试中存在的特定模态源不敏感。此外,我们还采用了自我蒸馏方法,以在两种模态都可用时保持模型的原始性能。MiDl 无需重新训练,在各种预训练模型和数据集上进行的实验表明,其实现了显著的性能改善。
本文介绍了一个一阶段模态蒸馏框架,通过多任务学习将特权知识传递和模态信息融合为一个优化过程。通过联合适应网络和交叉翻译网络,解决了不完整模态输入的问题,并实现了最先进的性能。