LAMM:多模态提示学习的标签对齐

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究使用预训练语言模型(PLMs)进行视觉语言推理任务,并提出了Dynamic Visual Prompting(DVP)方法。DVP通过搜索算法将PLMs与不同的视觉语言任务相结合,实验证明DVP在效率和性能方面具有优势,并能适应预训练语言模型与VL任务相结合的需求。

🎯

关键要点

  • 研究使用预训练语言模型(PLMs)进行视觉语言推理任务。
  • 提出了Dynamic Visual Prompting(DVP)方法。
  • DVP通过搜索算法将PLMs与不同的视觉语言任务相结合。
  • DVP在效率和性能方面具有优势。
  • DVP能够适应预训练语言模型与视觉语言任务的结合需求。
➡️

继续阅读