本研究提出了一种Multitask-Gaze网络模型,旨在解决轻量级模型在凝视估计任务中的性能下降问题。通过引入单向卷积和注意力机制,提升了模型的表征能力。实验结果表明,在MPIIFaceGaze和Gaze360数据集上,模型性能分别提升1.71%和2.75%,同时参数和FLOPs分别减少75.5%和86.88%。
本研究探讨了DETR在医学成像中检测可疑区域的有效性,结果显示其优于传统方法。通过眼动追踪收集放射科医师的视觉关注,提出了医学对比度视线图像预训练(McGIP),提高了对比度学习的有效性。此外,研究还介绍了基于差分方法的凝视估计技术和联合注视位置检测方法,均表现出优越性能,推动了医学图像分析的发展。
本文提出了一种针对凝视估计的域通用化方法,通过特征净化和无监督学习显著提升模型性能。研究包括插拔式注视适应框架和低维注视表示学习,成功解决了跨领域问题,并在多个数据集上取得了先进结果。
本文提出了一种眼睛地标调整模块和局部动态损失,旨在精确重建不同眼睛状态。实验验证了该方法在实时凝视估计中的优越性能,能够在低计算资源下实现高精度的眼睛凝视方向预测。
本文介绍了基于对比学习的ConGaze框架,用于凝视估计。该框架利用未标记的面部图像进行无监督学习,在公共凝视估计数据集上取得较好效果,相对于基于监督学习的模型有显著改进。
完成下面两步后,将自动完成登录并继续当前操作。