TransGOP:基于 Transformer 的凝视对象预测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究介绍了一种基于Transformer的注视对象预测方法TransGOP,通过交叉注意力机制改善注视热图回归,并通过注视框损失实现整体框架的端到端训练。实验证明TransGOP在目标检测、注视估计和注视对象预测的任务上取得了最先进的性能。

🎯

关键要点

  • 该研究介绍了一种基于Transformer的注视对象预测方法TransGOP。
  • TransGOP利用Transformer进行对象检测和建立远距离注视关系。
  • 该方法采用对象到注视的交叉注意力机制改善注视热图回归。
  • 通过注视框损失实现整体框架的端到端训练。
  • 实验证明TransGOP在目标检测、注视估计和注视对象预测任务上取得了最先进的性能。
➡️

继续阅读