小红花·文摘

本研究提出了一种协作掩蔽与目标（CMT-MAE）的方法，解决了掩蔽自编码器在自我监督视觉表示学习中的反馈问题。通过教师模型和学生模型的线性聚合，CMT-MAE显著提升了模型性能，在ImageNet-1K上微调时，精确率从83.6%提高至85.7%。