弱监督时序动作定位的概率视觉-语言表示

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该研究提出了一种名为双向语义一致性约束的方法,用于改善弱监督下的视频分类及定位发现问题。该方法通过时间相关增强和语义一致性约束来区分正样本动作和co-scene动作,取得了较好的性能。

🎯

关键要点

  • 该研究提出了一种名为双向语义一致性约束的方法。
  • 该方法旨在改善弱监督下的视频分类及定位问题。
  • 采用时间相关增强来打破正样本动作与co-scene动作之间的相关性。
  • 通过语义一致性约束获得足够的信息以区分正样本和co-scene动作。
  • 该方法在当前的WTAL方法中应用良好。
  • 在THUMOS14和ActivityNet数据集上取得了较好的性能。
➡️

继续阅读