双对齐下的上下文感知视觉 - 语言模型提示调优
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究提出了一种名为UPT的方法,通过学习微小的神经网络来联合优化跨不同模态的提示,取得了较好的few-shot learning和domain generalization的效果。在11个视觉数据集上进行了测试。
🎯
关键要点
- 该研究提出了一种名为UPT的方法。
- UPT通过学习微小的神经网络来联合优化跨不同模态的提示。
- 在11个视觉数据集上进行了强有力的测试。
- UPT在few-shot learning和domain generalization方面取得了较好的效果。
➡️