小红花·文摘 - 小红花技术领袖俱乐部

Mamba核心作者Tri Dao提出了两种新注意力机制GTA和GLA，旨在优化推理，解码速度和吞吐量提升2倍，同时减少内存使用，保持模型性能，解决长上下文推理中的内存和计算瓶颈问题。

Mamba核心作者新作:取代DeepSeek在用的注意力机制，专为推理打造

量子位 ·

本研究解决了放射学报告生成中的信息整合问题，提出了一种针对胸部X光的视觉语言模型。通过将胸部X光图像与预训练的视觉编码器对齐并与基于Vicuna-7B架构的语言模型结合，该方法实现了对胸部X光图像的准确理解与描述，显著提高了放射学报告的生成效率和准确性。

Gla-AI4BioMed在RRG24：针对放射学报告生成的视觉指令调优适应

BriefGPT - AI 论文速递 ·

本研究提出了一种全局-局部对齐领域适应方法（GLA-DA），通过对抗编码实现全局特征对齐，结合相似性和深度学习模型，为无标签目标数据分配伪标签，从而提高分类性能。

GLA-DA：多变量时间序列的全局-局部对齐领域适应

BriefGPT - AI 论文速递 ·