小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新方法，通过控制连续决策的时间尺度和扩展动作，解决了连续时间系统模型中的高计算成本问题，显著提升了规划和模型基础强化学习的效率与效果。

通过时间扩展动作来提高规划和模型基础强化学习

BriefGPT - AI 论文速递 ·