本文提出了一个基于序列到序列解决视频动作分割的统一框架,通过全面时间戳监督设置的 seq2seq 翻译,映射视频帧序列到动作分段序列,解决动作分割问题。通过修改和辅助损失函数,以及针对长输入序列和较少视频输出序列的模块化方法,提高了模型性能。在完全和时间戳监督设置中,该框架表现出色,超过了几个数据集上的最先进算法。
完成下面两步后,将自动完成登录并继续当前操作。