通过时间动作分割提升心肺复苏指导的层次化变压器

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文提出了一个基于序列到序列解决视频动作分割的统一框架,利用全面时间戳监督设置的 seq2seq 翻译。通过映射视频帧序列到动作分段序列的方法,解决动作分割问题。提出了修改和辅助损失函数,以及针对长输入序列和较少视频输出序列的模块化方法。引入了辅助监督信号和独立的对齐解码器,用于持续时间预测。通过有限 k-medoid 算法扩展框架到基于时间戳的监督设置,生成伪分割。在完全和时间戳监督设置中,框架表现一致,胜过或与几个数据集上的最先进算法相竞争。

🎯

关键要点

  • 提出了一个基于序列到序列的视频动作分割统一框架。
  • 利用全面时间戳监督设置的 seq2seq 翻译来解决动作分割问题。
  • 采用映射视频帧序列到动作分段序列的方法。
  • 提出了一系列修改和辅助损失函数,针对长输入序列和较少视频输出序列的模块化方法。
  • 为编码器引入辅助监督信号,提出独立的对齐解码器用于持续时间预测。
  • 通过有限 k-medoid 算法扩展框架到基于时间戳的监督设置,生成伪分割。
  • 框架在完全和时间戳监督设置中表现一致,超越或与最先进算法竞争。
➡️

继续阅读