HyperAI超神经 ·

剑桥大学等提出面向对地观测任务的像素级基础模型，在多项任务中精度达SOTA

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

对地观测卫星在农业和生态监测中至关重要，但卫星数据常受云层干扰。研究团队提出TESSERA模型，利用含云数据学习地表变化，优化数据处理流程，提升模型在低标注和稀疏数据下的表现，展现出更强的鲁棒性和泛化能力。

🎯

🔎

对地观测卫星在农业和生态监测中发挥着重要作用，但云层遮挡常导致数据质量下降。传统的去云技术虽然能提升数据可用性，却可能导致关键信息流失。TESSERA模型通过直接利用含云数据，避免了信息损失，展现出更强的鲁棒性。

TESSERA模型采用双分支编码器，分别处理光学和雷达数据，充分挖掘各自特征。这种多模态融合的方式，使得模型在分类、分割和回归任务中表现出色，尤其在低标注和稀疏数据条件下，展现出更强的稳定性和泛化能力。

在标注稀缺的场景中，TESSERA模型依然能够保持较高的分类精度，尤其在仅使用1%标注数据的情况下，性能提升显著。这表明该模型能够有效捕捉地表长期变化规律，适应真实世界中的复杂数据环境。

❓

TESSERA模型的主要创新点在于不再过滤含云数据，而是通过自监督学习框架让模型自主学习地表稳定的时空变化规律，形成具有时序采样不变性的遥感特征表示。

在低标注数据下，TESSERA模型展现出显著的优势，能够保持稳定性能，分类精度较最优基线提升约8个百分点，尤其在仅使用1%标注数据的情况下表现突出。

TESSERA模型采用双分支编码器，分别处理光学和雷达数据，充分挖掘各自特征，再通过融合实现多模态互补。

在分类任务中，TESSERA模型展现出显著的时序特征学习优势，尤其在国家尺度树种分类和精细化作物分类任务中均取得领先表现。

TESSERA模型通过引入混合正则化与全局打乱策略，提升了模型对观测扰动和空间自相关性的鲁棒性，使其在复杂数据条件下表现更为稳定。

TESSERA模型的预训练策略基于巴洛双子自监督学习框架，通过从同一d-pixel的完整时间序列中随机抽取观测子集，训练模型学习稳定的地表规律。

🏷️