本研究提出了历史增强锚定变压器(HAT)框架,解决了在线视频理解中忽略历史信息的问题。实验证明,该模型在程序性自我中心数据集上超越了最先进的方法,显示了利用长期历史信息的重要性。
完成下面两步后,将自动完成登录并继续当前操作。