本研究提出LIFESTATE-BENCH基准,以评估大型语言模型在多轮交互中的角色行为和终身学习能力。结果表明,非参数方法优于参数方法,但模型仍面临灾难性遗忘问题,强调了终身学习的重要性。
完成下面两步后,将自动完成登录并继续当前操作。