GroupMamba: 参数高效、准确的群组视觉状态空间模型
原文中文,约500字,阅读约需2分钟。发表于: 。我们的研究论文主要关注于解决基于状态空间模型的计算机视觉模型在规模化和效率方面的挑战,提出了一种 Modulated Group Mamba 层以及基于蒸馏的训练目标,通过实验证明这些贡献能够带来优越的性能表现,尤其在 ImageNet-1K 图像分类、MS-COCO 目标检测、ADE20K 语义分割等任务上取得了最先进的性能。
本研究探索了视觉状态空间模型在轻量级模型设计中的潜力,并提出了一种新的高效模型变体EfficientVMamba。实验结果表明,EfficientVMamba在各种视觉任务中取得了有竞争力的结果。