戏剧:基于Mamba的模型驱动强化学习在样本和参数效率方面的提升

📝

内容提要

本研究解决了模型驱动强化学习中的数据效率问题,尤其是动态模型所面临的学习和计算复杂性。提出了一种基于Mamba的状态空间模型,能够有效捕捉长期依赖关系,并实现更低的内存和计算复杂性。该模型支持在计算资源有限的环境中训练,展示了与其他领先模型驱动强化学习算法相当的性能。

🏷️

标签

➡️

继续阅读