细粒度时空运动对齐以用于对比视频表示学习

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文提出了Fine-grained Motion Alignment(FIMA)框架,通过对比学习生成像素级的运动监督,消除时间和空间上的弱对齐。使用帧级运动对比损失提高运动特征的时间多样性。实验证明FIMA在UCF101、HMDB51和Diving48数据集上取得了竞争性结果。

🎯

关键要点

  • 提出了Fine-grained Motion Alignment(FIMA)框架,旨在引入对齐良好的运动信息。
  • 通过开发密集的对比学习框架生成像素级的运动监督,消除时间和空间上的弱对齐。
  • 设计了运动解码器和前景采样策略以增强运动特征的表现。
  • 引入帧级运动对比损失以提高运动特征的时间多样性。
  • 实验证明FIMA在UCF101、HMDB51和Diving48数据集上取得了竞争性结果,展示了出色的动态感知能力。
  • 相关代码可在GitHub上找到。
➡️

继续阅读