小红花·文摘

本文研究了一种新型医学图像分割模型Vision Mamba UNet (VM-UNet)，该模型结合了状态空间模型和视觉上下文信息，展现出优异的分割性能。通过引入Visual State Space块和不对称编码器-解码器结构，VM-UNet在多个公共数据集上表现出色，为高效分割系统的开发奠定了基础。

xLSTM-UNet 可作为一个有效的 2D 和 3D 医学图像分割骨干，其 Vision-LSTM (ViL) 相较于其 Mamba 对应物更佳

BriefGPT - AI 论文速递 ·

LOCOST是一种基于状态空间模型的编码器-解码器结构，用于生成带有长上下文输入的条件文本。它具有低复杂度的计算和处理超长序列的能力。LOCOST在长篇摘要任务上与同等规模的顶级稀疏转换器相媲美，并在训练和推理过程中节省了大量内存。此外，LOCOST还能有效处理超过600K个标记的输入文本，并在全书摘要任务上达到了新的最先进水平。

LOCOST: 面向长文档提要生成的状态空间模型

BriefGPT - AI 论文速递 ·

本研究提出了首个编码器-解码器结构的预训练模型，用于冒犯语言识别，并在两个大型数据集上进行了训练。研究结果显示，该模型在多个英文基准测试中优于其他模型，实现了新的最优表现。

多语言冒犯性语言识别的文本对文本模型

BriefGPT - AI 论文速递 ·

DETRack是一种高效的视觉目标跟踪框架，使用编码器-解码器结构和可变形Transformer解码器作为目标头，减少了GFLOPs并加快了模型的收敛速度。实验证实了该方法的有效性和高效性。

形变变换器用于视觉跟踪的高效训练

BriefGPT - AI 论文速递 ·

该研究提出了一种基于3D点云的局部扫描方法，用于自动补全物体和场景。通过特定的编码器-解码器结构和新型层的使用，该方法在对象和室内场景自动补全任务中表现出优异性能，提高了技术水平。

点云学习的分离式局部聚合

BriefGPT - AI 论文速递 ·