TransGOP:基于 Transformer 的凝视对象预测
原文中文,约300字,阅读约需1分钟。发表于: 。该研究介绍了一种基于 Transformer 的注视对象预测方法 TransGOP,该方法利用 Transformer 进行对象检测和建立远距离注视关系,采用对象到注视的交叉注意力机制来改善注视热图回归,并通过注视框损失实现整体框架的端到端训练。实验证明 TransGOP 在目标检测、注视估计和注视对象预测的所有任务上均取得了最先进的性能。
该研究介绍了一种基于Transformer的注视对象预测方法TransGOP,通过交叉注意力机制改善注视热图回归,并通过注视框损失实现整体框架的端到端训练。实验证明TransGOP在目标检测、注视估计和注视对象预测的任务上取得了最先进的性能。