小红花·文摘

本文介绍了一种名为CERL的可扩展框架，结合神经进化和强化学习，生成超越个体学习器的新兴学习器。实验表明，该学习器在连续控制基准测试中表现优异，具有更高的采样效率。同时，文章综述了进化强化学习的最新研究进展，探讨了不同算法的整合及未来研究方向。