本研究提出了一种高效方法,通过对训练语料的子集进行训练和评估,实现数据消融的近似。发现单个模型在候选数据集上的困惑度与不同数据分割上训练的模型参数平均困惑度密切相关。此方法提升了训练效率,并为模型性能改进提供新途径。
完成下面两步后,将自动完成登录并继续当前操作。