小红花·文摘

本文介绍了InstructMining和DiverseEvol等方法，用于选择高质量的指令数据以优化大型语言模型的微调。研究表明，这些方法能够在有限数据下保持或提升模型性能，并通过多样性和质量的筛选显著降低训练成本。此外，研究系统回顾了现有数据选择方法，提出了新的分类法和数据合成方法DELIA，以提升模型的适应性和性能。