应对测试时自鸣镜视频中的缺失模态
本文介绍了一个一阶段模态蒸馏框架,通过多任务学习将特权知识传递和模态信息融合为一个优化过程。通过联合适应网络和交叉翻译网络,解决了不完整模态输入的问题,并实现了最先进的性能。
原文中文,约400字,阅读约需1分钟。
本文介绍了一个一阶段模态蒸馏框架,通过多任务学习将特权知识传递和模态信息融合为一个优化过程。通过联合适应网络和交叉翻译网络,解决了不完整模态输入的问题,并实现了最先进的性能。