小红花·文摘

本文介绍了一种新的方法，即遮蔽特征建模（MFM），用于无监督的图注意力网络（GAT）块的预训练。MFM利用预训练的视觉令牌生成器重构视频中对象的遮蔽特征，利用MiniKinetics数据集。实验评估表明，MFM有效地改进了事件识别性能。