本研究提出了一种新的掩蔽自我-他建模方法(BYOV),旨在改善视角不变的视频表示学习。实验结果表明,BYOV在多个任务中显著优于现有方法,提升了视频理解能力。
本文提出了一种基于对比学习的新颖视角不变的面部表情识别框架ViewFX。该方法在多视角面部表情识别数据集上表现优于以往的方法,并且对观察角度和训练样本标签数目的变化具有较低的敏感性。同时,还进行了详尽的敏感度和消融实验。
该文介绍了一种可伸缩的无监督面向对象中心的3D场景表示学习方法,通过学习在局部对象坐标系统中视角不变的3D对象表示,从而推断和维护3D场景的对象中心表示。
完成下面两步后,将自动完成登录并继续当前操作。