该研究提出了一种高效调优屏幕截图字幕任务的方法,通过冻结模型参数并仅训练相关权重,可以实现与整个模型微调相当的性能,同时大幅减少参数数量。研究还探讨了适配器在视觉语言模型中的应用。
完成下面两步后,将自动完成登录并继续当前操作。