多分辨率音视频特征融合用于时序动作定位

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了视频中查找特定动作片段的时间行为定位问题,提出了IntraC和InterC两个正则化项以适应时间约束条件,并在两个数据集上进行了实验。结果表明该方法优于基线,并可推广到其他方法。

🎯

关键要点

  • 本文研究了时间行为定位(TAL)在不带剪辑的视频中查找特定动作片段的问题。
  • 现有方法在模拟阶段时忽略了动作片段之间的潜在时间约束。
  • 提出了 IntraC 和 InterC 两个正则化项,以适应时间约束条件。
  • 在 THUMOS14 和 ActivityNet1.3 两个数据集上进行了实验。
  • 实验结果表明该方法在定量和定性上优于基线。
  • 所提出的正则化方法可以推广到其他 TAL 方法,如 TSA-Net 和 PGCN。
➡️

继续阅读