小红花·文摘

本研究提出了混合模态适应方法（MMA），通过轻量级适配器模块实现图像与语言模型的联合优化，提升训练效率和性能。同时，介绍了PROOF模型以解决视觉语言模型的遗忘问题，Dynamic Visual Prompting（DVP）方法有效结合预训练语言模型与视觉语言任务。Prompt-based Continual Learning（LGCL）和ConvPrompt模型进一步提升了连续学习性能，展示了在多模态任务中的应用潜力。

CluMo：基于聚类的模态融合提示在视觉问答中的持续学习

BriefGPT - AI 论文速递 ·

本文研究了使用预训练语言模型（PLMs）进行视觉语言推理的动态视觉提示（DVP）方法，提出了细粒度视觉提示（FGVP）和可转移视觉提示（TVP）方法，通过优化提示设计和训练策略，显著提升了多模态大语言模型在下游任务中的表现。

面向高效视觉 - 语言微调的记忆空间视觉提示

BriefGPT - AI 论文速递 ·

本研究通过引入对抗性提示调整（AdvPT）技术，提升视觉-语言模型的鲁棒性，改善对抗攻击脆弱性。提出了多任务视觉语言提示调整（MVLPT）和动态视觉提示（DVP）等新方法，在多个视觉任务上表现优异。同时，研究探讨了多模态提示和渐进式视觉提示结构的应用，显著提高了模型在少样本情况下的性能。

逐步多模态条件提示调整

BriefGPT - AI 论文速递 ·

本文研究了预训练语言模型在视觉语言推理任务中的应用，提出了动态视觉提示和多任务视觉语言提示调整等新方法，显著提升了模型的效率和性能。此外，自适应集成方法和视觉提示结合技术在多种任务中表现优异，展现了良好的适应性和泛化能力。

探索视觉提示在多模态大型语言模型中的可转移性

BriefGPT - AI 论文速递 ·

本文提出了一种改进的视觉提示调整方法（VPT），通过优化预训练模型在下游任务中的表现，显著提升了自我监督预训练的适应性。动态视觉提示调整（DVPT）为每个图像生成实例级标记，提升了识别任务的性能。同时，提示凝聚技术有效减少了提示数量，保持了模型的准确度。整体上，VPT方法在多个基准测试中优于传统微调方法。

iVPT：通过跨层动态连接改进视觉提示调整中的任务相关信息共享

BriefGPT - AI 论文速递 ·

本文介绍了多种视觉-语言模型的优化方法，包括智能修剪、动态视觉提示和高效VLM模型。这些方法通过剪枝、蒸馏和动态调整等技术，提高了模型的效率和性能，适应资源受限的场景，显著降低计算成本，同时保持高准确性。

MADTP：多模态对齐引导的动态标记修剪加速视觉 - 语言转换器

BriefGPT - AI 论文速递 ·