本研究提出了一种新的多层递归注意模型(MRAM),有效模拟人类视觉体系的层次结构,改善了注视与扫视的平衡,并在图像分类基准测试中超越了现有模型。
我们提出一个机械模型,模拟动态实景中的对象分割和凝视行为,使用场景分割进行对象导向的扫视决策,并使用视点对象递归地完善场景分割。通过贝叶斯滤波器来模拟这种完善过程,我们演示了这个模型如何与观察者的自由视觉行为密切相似,并通过大量模拟和消融研究显示了不确定性如何促进均衡的探索和语义对象线索对于形成对象导向注意的感知单元的重要性。此外,我们展示了我们模型的模块化设计如何允许扩展,如引入视觉动量或...
本文评估了人类扫视路径预测模型,提出了新的评估指标并比较了现有模型的性能。引入MIT/Tuebingen Saliency Benchmark数据集作为基准,研究了Eyettention和EyeFormer模型,展示了它们在视觉扫描路径预测中的优势。此外,基于卷积神经网络的方法探讨了专家与新手在阅读牙齿放射图时的眼动差异,提出了HAT模型和AbSViT模型,推动了视觉任务导向注意的研究。
完成下面两步后,将自动完成登录并继续当前操作。