本文探讨了通过编程提示结构和广义领域提示学习(GDPL)框架,提升视觉语言模型(VLMs)在特定领域的应用。GDPL利用小规模基础模型和少量提示样本,减少对大量数据和资源的依赖,促进可持续的VLMs研究。实验结果显示,该框架在多个领域的任务中表现优异,推动了学术界与工业界的合作。
完成下面两步后,将自动完成登录并继续当前操作。