该研究提出了一种基于物理学进展的新方法,能够在少量轨迹采样下实现基于模型的强化学习。实验结果显示该方法具有强泛化能力和性能表现,且需要较少真实物理系统轨迹。
完成下面两步后,将自动完成登录并继续当前操作。