小红花·文摘

该研究提出了一种高效调优屏幕截图字幕任务的方法，通过冻结模型参数并仅训练相关权重，可以实现与整个模型微调相当的性能，同时大幅减少参数数量。研究还探讨了适配器在视觉语言模型中的应用。