OAT: 目标层级注意力变换器用于凝视扫描路径预测
原文中文,约200字,阅读约需1分钟。发表于: 。目标与背景的关系对于视觉搜索中的视觉注意力分配至关重要。本文介绍了一种基于目标的注意力转换器,通过预测人类在混杂场景中搜索目标对象时的扫描路径来提高预测精度,并通过实验证明了其在未知布局和目标对象下的泛化能力。
该研究使用基于Transformer的架构自动检测图像中的对象,并建立对象与注视的关联,实现全面的、可解释的注视分析。该方法在各项指标上取得了最新的成果,对注视目标检测、注视距离、注视对象分类和定位平均精度均有显著提高。