本论文介绍了两种新型模型强化学习框架,使用神经常微分方程建模连续时间动力学,准确表征动态并开发高效策略。同时,基于模型的方法优化时间表,减少与环境交互频率,保持近乎最优性能。实验证明方法有效。
完成下面两步后,将自动完成登录并继续当前操作。