本文提出了一种系统方法,通过缩放法则确定目标领域的最佳数据混合比例,以提升大规模模型的性能。该方法能够准确预测模型在特定领域权重下的损失,并在大型语言模型、多模态模型和视觉模型的预训练中验证其有效性。通过少量小规模训练,能够估计参数并推断更大规模的性能,提供了一种替代昂贵试错方法的方案。
完成下面两步后,将自动完成登录并继续当前操作。