Seg-LSTM: 遥感图像语义分割的 xLSTM 性能
原文中文,约500字,阅读约需2分钟。发表于: 。近期自回归网络的线性复杂度提升极大地推动了研究进展,在大型语言模型上表现出色。代表性模型为扩展长短期记忆网络 (xLSTM),其融合了门控机制和记忆结构,在长序列语言任务上与 Transformer 架构可媲美。自回归网络如 xLSTM 可利用图像串行化扩展其应用于诸如分类和分割等视觉任务。尽管现有研究已经在图像分类方面证明了 Vision-LSTM...
近期自回归网络的线性复杂度提升极大地推动了研究进展,代表性模型为扩展长短期记忆网络 (xLSTM),其在大型语言模型上表现出色。然而,Vision-LSTM 在图像语义分割方面的表现受限,一般较 Vision-Transformers 和 Vision-Mamba 模型差强人意。建议未来研究方向是增强 Vision-LSTM。