语言模型作为视觉 - 语言模型的黑盒优化器
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该文介绍了一种软提示学习的方法,可用于Vision & Language模型,通过最小化软提示与手工工程提示之间的距离来提高模型性能,并能够训练虚拟类。该方法在11个数据集上进行的广泛评估表明,显著优于所有先前的软提示工作,并在大多数测试数据集上匹配和超越手工制作提示和CLIP的新类准确性。
🎯
关键要点
- 介绍了一种软提示学习的方法,用于 Vision & Language 模型。
- 该方法通过最小化学习的软提示与手工工程提示之间的距离来提高模型性能。
- 能够训练虚拟类。
- 在 11 个数据集上进行的评估表明,该方法显著优于所有先前的软提示工作。
- 在大多数测试数据集上,该方法匹配和超越手工制作提示和 CLIP 的新类准确性。
➡️