本研究使用遮罩图像建模学习视网膜OCT图像的表示,通过遮罩自编码器在真实世界临床环境中训练,得出有力且通用的OCT图像表示。提出了扩展的MAE预训练方法,将OCT与红外眼底图像结合,提高了性能。实验利用了公开可用的OCT数据集,为未来比较工作提供了可能。
本文通过实证研究确认了基于像素的遮罩图像建模的限制,并提出了一种新方法,利用浅层的低级特征辅助像素重建。该方法在多个下游任务中取得了实质性的改进,特别是在较小的模型上。
本研究调查了遮罩图像建模(MIM)在计算机视觉中的最新研究进展,通过分类和审查两种实现MIM的方式,提出了未来研究的多个方向。
本文介绍了一种基于自监督学习的驾驶员分心检测方法,使用遮罩图像建模和Swin Transformer编码器,通过数据增广和随机遮罩策略提高模型性能,准确率达99.60%。
本文发现基于像素的遮罩图像建模存在限制,并提出了一种新方法,利用浅层低级特征辅助像素重建。该方法在多个下游任务中取得了实质性改进,特别是在较小的模型上。
完成下面两步后,将自动完成登录并继续当前操作。