历史增强锚定变压器用于在线时间动作定位

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了历史增强锚定变压器(HAT)框架,解决了在线视频理解中忽略历史信息的问题。实验证明,该模型在程序性自我中心数据集上超越了最先进的方法,显示了利用长期历史信息的重要性。

🎯

关键要点

  • 本研究提出了历史增强锚定变压器(HAT)框架。
  • 该框架解决了在线视频理解中忽略历史信息的问题。
  • HAT框架通过整合历史上下文,提升了长短期信息的协同作用。
  • 实验结果显示,该模型在程序性自我中心数据集上超越了最先进的方法。
  • 在标准数据集上,该模型表现出可比或稍优的性能。
  • 研究凸显了在程序性和自我中心行为场景中利用长期历史信息的重要性。
➡️

继续阅读