该研究介绍了一种基于Transformer的注视对象预测方法TransGOP,通过交叉注意力机制改善注视热图回归,并通过注视框损失实现整体框架的端到端训练。实验证明TransGOP在目标检测、注视估计和注视对象预测的任务上取得了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。