该研究使用基于Transformer的架构自动检测图像中的对象,并建立对象与注视的关联,实现全面的、可解释的注视分析。该方法在各项指标上取得了最新的成果,对注视目标检测、注视距离、注视对象分类和定位平均精度均有显著提高。
完成下面两步后,将自动完成登录并继续当前操作。