一次性进行的无监督运动分割:对视频进行平滑长期建模

💡 原文中文,约500字,阅读约需1分钟。
📝

内容提要

该文介绍了一种新型的无监督视频对象分割方法,利用外观和运动线索检测视频中最显著的对象。该方法设计了一种新型运动作为选项网络,并提出了自适应输出选择算法。在所有公共基准数据集上具有最先进的性能,保持实时推理速度。

🎯

关键要点

  • 无监督视频对象分割旨在检测视频中最显著的对象,无需外部指导。
  • 显著对象通常与背景具有不同的运动特征,最近的方法结合了运动线索和外观线索。
  • 光流图与分割掩码相关,导致网络在训练期间过度依赖运动线索。
  • 为了解决这一问题,设计了一种新型运动作为选项网络,将运动线索视为可选。
  • 在训练期间,随机提供RGB图像而非光流图,以降低网络的运动依赖性。
  • 学习到的运动编码器能够处理RGB图像和光流图,生成两种不同的预测。
  • 提出了一种自适应输出选择算法,在测试时采用最佳的预测结果。
  • 该方法在所有公共基准数据集上表现出最先进的性能,并保持实时推理速度。
➡️

继续阅读