本研究提出序列顺序回忆任务(SORT),用于评估大型语言模型的情节记忆能力。通过Book-SORT数据集测试发现,模型在有上下文时表现良好,但在仅有训练文本时表现较差。SORT为记忆评估提供了新方法,助力记忆增强模型的发展。
完成下面两步后,将自动完成登录并继续当前操作。