小红花·文摘

本文探讨了多模态大语言模型在图像分类中的少样本微调，提出了CLS-RL方法，通过可验证信号作为奖励来克服过拟合问题。研究表明，CLS-RL在多数数据集上优于传统方法，提升了模型的性能和泛化能力。