IterSelectTune:一种高效的迭代训练框架用于选择指令调优数据
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了IterSelectTune框架,通过对约20%的数据进行微调,减少了选择高质量指令数据的人力投入。该方法无需人工或仅有限依赖GPT-4,显著提升性能并降低计算资源消耗,在多个基准测试和公共数据集上表现优于全数据集微调的模型。
🏷️