本文介绍了一种名为CERL的可扩展框架,结合神经进化和强化学习,生成超越个体学习器的新兴学习器。实验表明,该学习器在连续控制基准测试中表现优异,具有更高的采样效率。同时,文章综述了进化强化学习的最新研究进展,探讨了不同算法的整合及未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。