本研究改进了大规模语言模型预训练中训练数据归属的方法,提高了处理超大规模数据集的效率。结果表明,该方法在识别影响模型预测的实例方面表现优异,揭示了事实归属与因果影响之间的错位,提示随着模型规模和数据的增加,影响与归属关系更加紧密。
完成下面两步后,将自动完成登录并继续当前操作。