小红花·文摘

本文探讨了通过编程提示结构和广义领域提示学习（GDPL）框架，提升视觉语言模型（VLMs）在特定领域的应用。GDPL利用小规模基础模型和少量提示样本，减少对大量数据和资源的依赖，促进可持续的VLMs研究。实验结果显示，该框架在多个领域的任务中表现优异，推动了学术界与工业界的合作。