OAT: 目标层级注意力变换器用于凝视扫描路径预测
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究使用基于Transformer的架构自动检测图像中的对象,并建立对象与注视的关联,实现全面的、可解释的注视分析。该方法在各项指标上取得了最新的成果,对注视目标检测、注视距离、注视对象分类和定位平均精度均有显著提高。
🎯
关键要点
- 该研究使用基于Transformer的架构自动检测图像中的对象。
- 建立对象与注视的关联,实现全面的、可解释的注视分析。
- 注视分析包括注视目标区域、注视像素点、被注视对象的类别和图像位置。
- 该方法在各项指标上取得了最新的成果。
- 注视目标检测的AUC提高了2.91%。
- 注视距离减少了50%。
- 注视对象分类和定位平均精度提高了11-13%。
- 代码可在链接中获得。
🏷️
标签
➡️