本研究提出了一种新的掩蔽自我-他建模方法(BYOV),旨在改善视角不变的视频表示学习。实验结果表明,BYOV在多个任务中显著优于现有方法,提升了视频理解能力。
完成下面两步后,将自动完成登录并继续当前操作。