Diffusion-RSCC: 遥感图像中变化描述的扩散概率模型
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
远程感知图像变化字幕化的新方法RSCaMa利用Mamba模型处理多时相遥感图像中的表面变化。实验证明了RSCaMa的卓越性能以及Mamba在RSICC任务中的潜力。同时,对比了三种语言解码器的效果,为未来的RSICC研究提供了有价值的见解。
🎯
关键要点
- 远程感知图像变化字幕化通过识别多时相遥感图像中的表面变化并用自然语言描述它们。
- 当前的方法通常依赖于编码器 - 解码器结构,重点设计复杂的颈部来处理双时相特征。
- Mamba模型在许多领域展示了出色的性能,特别是在特征选择建模能力方面。
- 本文提出了一种名为RSCaMa的新方法,将Mamba引入到RSICC任务中。
- RSCaMa利用孪生骨干提取双时相特征,通过SD-SSM和TT-SSM的多CaMa层进行处理。
- SD-SSM增强变化感知能力,TT-SSM促进双时相交互作用。
- 实验证明了CaMa层的有效性,展示了RSCaMa的卓越性能和Mamba在RSICC任务中的潜力。
- 系统比较了三种语言解码器的效果,为未来的RSICC研究提供了有价值的见解。
➡️