本文提出了一种针对凝视估计的域通用化方法,通过特征净化和无监督学习显著提升模型性能。研究包括插拔式注视适应框架和低维注视表示学习,成功解决了跨领域问题,并在多个数据集上取得了先进结果。
本文介绍了一种基于数据增强驱动的方法,使用重新参数化的视觉Transformer(ReVT)和多模型训练后的权重平均化,实现了语义分割的域通用化。该方法在多个基准数据集上实现了小型模型和中型模型的最新mIoU性能,分别为47.3%和50.1%,相比之前的技术提高了1%和2.3%。此外,该方法需要更少的参数,帧速率更高,易于实施,并且在推断期间不会增加计算复杂度。
完成下面两步后,将自动完成登录并继续当前操作。