MAMOC:通过蒙版自编码进行 MRI 运动校正

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文章介绍了一种运动引导的掩蔽算法(MGM),通过利用运动矢量来引导每个掩蔽的位置,从而更高效地利用视频显著性。该算法在两个大规模视频基准中提高了1.3%的性能,并且只使用了最多66%的训练时期。此外,该算法在下游迁移学习和领域自适应任务中展现了更好的泛化能力,相比基线方法提高了4.9%。

🎯

关键要点

  • 提出了一种运动引导的掩蔽算法 (MGM),利用运动矢量引导掩蔽位置。
  • MGM 在 Kinetics-400 和 Something-Something V2 两个大规模视频基准中提高了 1.3% 的性能。
  • MGM 只使用最多 66% 的训练时期,便可获得与先前视频 MAE 相等的性能。
  • MGM 在 UCF101、HMDB51 和 Diving48 数据集上展现了更好的泛化能力。
  • 与基线方法相比,MGM 在下游迁移学习和领域自适应任务中提高了 4.9% 的性能。
➡️

继续阅读