VistaFormer:用于卫星图像时间序列分割的可扩展视觉变换器
发表于: 。本研究提出VistaFormer,一种轻量级的基于变换器的模型架构,解决遥感图像语义分割中的性能短板。该模型通过无位置自注意力层简化架构,并利用邻域注意力替代多头自注意力,从而提高模型的可扩展性。实验结果表明,VistaFormer在PASTIS和MTLCC基准测试中表现优异,尤其是在资源使用效率上显著降低。
本研究提出VistaFormer,一种轻量级的基于变换器的模型架构,解决遥感图像语义分割中的性能短板。该模型通过无位置自注意力层简化架构,并利用邻域注意力替代多头自注意力,从而提高模型的可扩展性。实验结果表明,VistaFormer在PASTIS和MTLCC基准测试中表现优异,尤其是在资源使用效率上显著降低。