Famba-V:结合跨层令牌融合的快速视觉Mamba
原文中文,约500字,阅读约需2分钟。发表于: 。本文解决了基于Transformer架构的模型训练效率低下的问题。通过引入Famba-V,一种跨层令牌融合技术,研究提出了一种新颖的方法,将相似令牌在不同的视觉Mamba层中进行融合,从而提高了训练效率。实验结果表明,Famba-V显著减少了训练时间和峰值内存使用,并在准确性与效率之间提供了更好的平衡,展现了其作为视觉Mamba模型效率提升技术的潜力。
本研究探索了视觉状态空间模型在轻量级模型设计中的潜力,并提出了一种新的高效模型变体EfficientVMamba。实验结果表明,EfficientVMamba在各种视觉任务中取得了有竞争力的结果。