本研究提出了AMEGO方法,用于改善自我中心视频的理解。该方法通过构建自包含表征来捕捉关键位置和对象交互,并实现了对视频的多重查询。实验结果显示AMEGO在新引入的主动记忆基准上表现优异。
完成下面两步后,将自动完成登录并继续当前操作。