小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新的掩蔽自我-他建模方法（BYOV），旨在改善视角不变的视频表示学习。实验结果表明，BYOV在多个任务中显著优于现有方法，提升了视频理解能力。

Bootstrap Your Own Views: Masked Ego-Exo Modeling for Fine-grained View-invariant Video Representations

BriefGPT - AI 论文速递 ·

该文介绍了一种可伸缩的无监督面向对象中心的3D场景表示学习方法，通过学习在局部对象坐标系统中视角不变的3D对象表示，从而推断和维护3D场景的对象中心表示。

可扩展的三维对象为中心学习的变异推断

BriefGPT - AI 论文速递 ·