LAMM:多模态提示学习的标签对齐
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究使用预训练语言模型(PLMs)进行视觉语言推理任务,并提出了Dynamic Visual Prompting(DVP)方法。DVP通过搜索算法将PLMs与不同的视觉语言任务相结合,实验证明DVP在效率和性能方面具有优势,并能适应预训练语言模型与VL任务相结合的需求。
🎯
关键要点
-
研究使用预训练语言模型(PLMs)进行视觉语言推理任务。
-
提出了Dynamic Visual Prompting(DVP)方法。
-
DVP通过搜索算法将PLMs与不同的视觉语言任务相结合。
-
DVP在效率和性能方面具有优势。
-
DVP能够适应预训练语言模型与视觉语言任务的结合需求。
🏷️