TransGOP:基于 Transformer 的凝视对象预测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究介绍了一种基于Transformer的注视对象预测方法TransGOP,通过交叉注意力机制改善注视热图回归,并通过注视框损失实现整体框架的端到端训练。实验证明TransGOP在目标检测、注视估计和注视对象预测的任务上取得了最先进的性能。
🎯
关键要点
- 该研究介绍了一种基于Transformer的注视对象预测方法TransGOP。
- TransGOP利用Transformer进行对象检测和建立远距离注视关系。
- 该方法采用对象到注视的交叉注意力机制改善注视热图回归。
- 通过注视框损失实现整体框架的端到端训练。
- 实验证明TransGOP在目标检测、注视估计和注视对象预测任务上取得了最先进的性能。
🏷️
标签
➡️