本文提出了一种基于引导注意力机制的短期对象交互预测方法,结合物体检测和时空特征,增强运动和上下文信息。新模型GANO在EGO4D数据集上表现优异,成功预测下一个活跃对象及其未来动作,取得最佳成绩。
本技术报告提出了一种基于引导注意力机制的解决方案来解决EGO4D短期预测挑战。该解决方案结合了物体检测和时空特征提取,增强了运动和上下文信息,并解码物体中心和运动中心的信息。在快速网络上应用引导关注力,构建了模型,在验证集和测试集上获得了更好的性能和最佳成绩。
完成下面两步后,将自动完成登录并继续当前操作。