小红花·文摘

本研究提出序列顺序回忆任务（SORT），用于评估大型语言模型的情节记忆能力。通过Book-SORT数据集测试发现，模型在有上下文时表现良好，但在仅有训练文本时表现较差。SORT为记忆评估提供了新方法，助力记忆增强模型的发展。