该文章介绍了一种运动引导的掩蔽算法(MGM),通过利用运动矢量来引导每个掩蔽的位置,从而更高效地利用视频显著性。该算法在两个大规模视频基准中提高了1.3%的性能,并且只使用了最多66%的训练时期。此外,该算法在下游迁移学习和领域自适应任务中展现了更好的泛化能力,相比基线方法提高了4.9%。
该文介绍了一种运动引导的掩蔽算法(MGM),以提高视频显著性。该算法在两个大规模视频基准中相比先前的最先进方法,为视频MAE提供了关键装备,并取得了高达+1.3%的改进。此外,该算法只使用了最多66%的训练时期,就可以获得与先前的视频MAE相等的性能。最后,该算法在多个数据集上对下游迁移学习和领域自适应任务的泛化能力比基线方法提高了高达+4.9%。
完成下面两步后,将自动完成登录并继续当前操作。