基于动作 - 过渡感知边界对齐的高效有效的弱监督动作分割
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文提出了一个基于序列到序列解决视频动作分割的统一框架,通过全面时间戳监督设置的 seq2seq 翻译,映射视频帧序列到动作分段序列,解决动作分割问题。通过修改和辅助损失函数,以及针对长输入序列和较少视频输出序列的模块化方法,提高了模型性能。在完全和时间戳监督设置中,该框架表现出色,超过了几个数据集上的最先进算法。
🎯
关键要点
- 提出了一个基于序列到序列的视频动作分割统一框架。
- 利用全面时间戳监督设置的seq2seq翻译映射视频帧序列到动作分段序列。
- 提出了一系列修改和辅助损失函数,以提高模型性能。
- 针对长输入序列和较少视频输出序列的模块化方法。
- 引入辅助监督信号和独立的对齐解码器用于隐式持续时间预测。
- 通过有限k-medoid算法扩展框架到基于时间戳的监督设置。
- 框架在完全和时间戳监督设置中表现出色,超过了多个数据集上的最先进算法。
➡️