本研究提出了一种“遗忘曲线”方法,以更可靠地评估长文档模型的记忆能力。结果表明,该方法在不同测试语料和实验设置下具有鲁棒性,适用于各种模型规模,并验证了变换器扩展技术的有效性。
完成下面两步后,将自动完成登录并继续当前操作。