本文探讨了多模态大语言模型在图像分类中的少样本微调,提出了CLS-RL方法,通过可验证信号作为奖励来克服过拟合问题。研究表明,CLS-RL在多数数据集上优于传统方法,提升了模型的性能和泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。