探索视觉提示在多模态大型语言模型中的可转移性
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究使用预训练语言模型(PLMs)进行视觉语言推理任务,提出了Dynamic Visual Prompting(DVP)转移学习方法,能有效结合不同的视觉语言任务。DVP在效率和性能方面具有优势,并能适应预训练语言模型与VL任务的需求。
🎯
关键要点
- 研究使用预训练语言模型(PLMs)进行视觉语言推理任务。
- 提出了Dynamic Visual Prompting(DVP)转移学习方法。
- DVP通过搜索算法有效结合不同的视觉语言任务。
- DVP在效率和性能方面具有优势。
- DVP能够适应预训练语言模型与视觉语言任务的需求。
➡️