小红花·文摘

该研究介绍了一种基于Transformer的注视对象预测方法TransGOP，通过交叉注意力机制改善注视热图回归，并通过注视框损失实现整体框架的端到端训练。实验证明TransGOP在目标检测、注视估计和注视对象预测的任务上取得了最先进的性能。