RoMA:扩展基于Mamba的遥感基础模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文探讨自监督学习在视觉变换器中的应用,提出RoMA框架,通过旋转感知预训练和多尺度令牌预测,提升高分辨率遥感图像的可扩展性。实验结果表明,RoMA预训练的Mamba模型在准确性和计算效率上优于基于ViT的模型。
🎯
关键要点
-
本文探讨自监督学习在视觉变换器中的应用。
-
提出RoMA框架,通过旋转感知预训练和多尺度令牌预测,提升高分辨率遥感图像的可扩展性。
-
自注意力的平方复杂性限制了扩展性。
-
RoMA框架有效利用大规模多样化的无标签数据。
-
实验结果表明,RoMA预训练的Mamba模型在准确性和计算效率上优于基于ViT的模型。
➡️