小红花·文摘

本文探讨了在指令微调阶段选择预训练大型语言模型（LLMs）数据的方法，提出了一种新的多模态评分机制，以提升数据质量和多样性。研究表明，该方法在多个实验中比随机采样和现有方法更有效，显著提高了模型性能。