本文提出了一种名为可微分数据选择(DDS)的强化学习方法,通过优化数据选择来提升机器翻译和图像分类等任务的性能。研究引入了“预学习数据大小”概念,提出了基于PMP的数据选择框架(PDS),并强调在微调模型时选择高质量数据的重要性。实验结果表明,该方法在资源有限的情况下显著提高了模型性能。
完成下面两步后,将自动完成登录并继续当前操作。