小红花·文摘

本研究提出了一种名为“多尝试，更美味”（TMTB）的框架，旨在降低密集场景中的标注成本。通过图像修复技术和视觉状态空间模型，增强数据多样性，显著提高了在极端拥挤和低光环境下的人群计数准确性。实验结果表明，该方法在多个基准数据集上超越了现有最优方案。

Taste More, Taste Better: Enhancing Semi-Supervised Crowd Counting with Diverse Data and Strong Models

BriefGPT - AI 论文速递 ·

本文介绍了一种新型视觉状态空间模型EfficientVMamba，该模型结合卷积和选择性扫描方法，显著提高了图像表示效果并降低了计算复杂性。在多种视觉任务中，尤其是在高分辨率输入下，该模型展现出竞争力的准确率提升。

QuadMamba: A Quadtree-Based Selective Scanning Visual State Space Model Learning

BriefGPT - AI 论文速递 ·

本文提出了一种新型视觉状态空间模型VMamba，结合卷积神经网络和视觉变换器，具有线性复杂度和全局感受野。研究表明，EfficientVMamba在视觉任务中表现优异，特别是在细粒度食物分类上，准确率达到79.54%。此外，VMamba在医学图像分割任务中也展现出竞争力，证明了状态空间模型在多模态学习中的潜力。

VMambaCC：一种用于人群计数的可视化状态空间模型

BriefGPT - AI 论文速递 ·

本研究探讨了视觉状态空间模型在轻量级模型设计中的应用，提出了高效模型EfficientVMamba，该模型结合了卷积和状态空间模块，显著提升了视觉任务的性能。实验结果显示，该模型在计算复杂性上有所降低，并在医学图像分析和遥感图像分类等多个视觉任务中表现优异。

FusionMamba：基于状态空间模型的高效图像融合

BriefGPT - AI 论文速递 ·