小红花·文摘

本研究提出LIFESTATE-BENCH基准，以评估大型语言模型在多轮交互中的角色行为和终身学习能力。结果表明，非参数方法优于参数方法，但模型仍面临灾难性遗忘问题，强调了终身学习的重要性。