本文介绍了在NeurIPS 2024自监督学习研讨会上接受的IJEPA模型,该模型为图像表示学习提供了一种新方案。IJEPA通过在潜在空间中进行预测,捕捉有用的语义信息,且依赖于精心设计的上下文和目标窗口。研究表明,结合上下文和目标窗口的位置可以提升模型在图像分类基准数据集上的表现和鲁棒性。
完成下面两步后,将自动完成登录并继续当前操作。