小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种结合视觉语言推理与无监督领域适应的方法，旨在解决现有分割模型在训练时的类别限制问题。通过多尺度上下文数据和增强文本嵌入，构建的UDA-FROVSS框架能够在无需共享类别的情况下有效适应不同领域，从而提高细粒度分割能力。

Visual Language Models and Unsupervised Domain Adaptation: Enhancing Transferability of Open Vocabulary Segmentation through Unsupervised Domain Adaptation

BriefGPT - AI 论文速递 ·

本文研究了使用预训练语言模型（PLMs）进行视觉语言推理的动态视觉提示（DVP）方法，提出了细粒度视觉提示（FGVP）和可转移视觉提示（TVP）方法，通过优化提示设计和训练策略，显著提升了多模态大语言模型在下游任务中的表现。

面向高效视觉 - 语言微调的记忆空间视觉提示

BriefGPT - AI 论文速递 ·

本文研究了预训练语言模型在视觉语言推理任务中的应用，提出了动态视觉提示和多任务视觉语言提示调整等新方法，显著提升了模型的效率和性能。此外，自适应集成方法和视觉提示结合技术在多种任务中表现优异，展现了良好的适应性和泛化能力。

探索视觉提示在多模态大型语言模型中的可转移性

BriefGPT - AI 论文速递 ·

本文研究使用预训练语言模型（PLMs）进行视觉语言推理任务，并提出了Dynamic Visual Prompting（DVP）方法。DVP通过搜索算法将PLMs与不同的视觉语言任务相结合，实验证明DVP在效率和性能方面具有优势，并能适应预训练语言模型与VL任务相结合的需求。

LAMM：多模态提示学习的标签对齐

BriefGPT - AI 论文速递 ·