本文介绍了一种新的方法,即遮蔽特征建模(MFM),用于无监督的图注意力网络(GAT)块的预训练。MFM利用预训练的视觉令牌生成器重构视频中对象的遮蔽特征,利用MiniKinetics数据集。实验评估表明,MFM有效地改进了事件识别性能。
完成下面两步后,将自动完成登录并继续当前操作。