该文介绍了一种运动引导的掩蔽算法(MGM),以提高视频显著性。该算法在两个大规模视频基准中相比先前的最先进方法,为视频MAE提供了关键装备,并取得了高达+1.3%的改进。此外,该算法只使用了最多66%的训练时期,就可以获得与先前的视频MAE相等的性能。最后,该算法在多个数据集上对下游迁移学习和领域自适应任务的泛化能力比基线方法提高了高达+4.9%。
完成下面两步后,将自动完成登录并继续当前操作。