V-JEPA是一种非生成式模型,通过预测视频的缺失或遮蔽部分来进行学习,提高训练和样本效率。它能够集中精力理解视频中的高层次概念信息,适应多种不同的任务。未来可能应用于具身AI研究和AR眼镜项目。
完成下面两步后,将自动完成登录并继续当前操作。