本文介绍了一种新颖的可进化的LLM智能体框架,名为REMEMBERER,具备长期记忆和利用过去经验的能力。通过引入具有经验记忆的强化学习(RLEM)来更新记忆,系统可以从成功和失败的经验中学习并提高能力。实验结果表明,REMEMBERER的平均结果超过了先前的SOTA 4%和2%,证明了其优越性和鲁棒性。
完成下面两步后,将自动完成登录并继续当前操作。