OAT: 目标层级注意力变换器用于凝视扫描路径预测

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该研究使用基于Transformer的架构自动检测图像中的对象,并建立对象与注视的关联,实现全面的、可解释的注视分析。该方法在各项指标上取得了最新的成果,对注视目标检测、注视距离、注视对象分类和定位平均精度均有显著提高。

🎯

关键要点

  • 该研究使用基于Transformer的架构自动检测图像中的对象。
  • 建立对象与注视的关联,实现全面的、可解释的注视分析。
  • 注视分析包括注视目标区域、注视像素点、被注视对象的类别和图像位置。
  • 该方法在各项指标上取得了最新的成果。
  • 注视目标检测的AUC提高了2.91%。
  • 注视距离减少了50%。
  • 注视对象分类和定位平均精度提高了11-13%。
  • 代码可在链接中获得。
➡️

继续阅读