该研究提出了一种双层马尔可夫决策过程(MDP)框架,用于科学任务的自主应变规划。研究结果表明,该方法可以提高计算可处理性和近似最佳策略,帮助更高效和灵活地应对科学任务的应变规划。
该研究提出了双层马尔可夫决策过程(MDP)框架,用于科学任务的自主应变规划。研究在RoverGridWorld环境中进行了测试,展示了计算可处理性和近似最佳策略的实现。
完成下面两步后,将自动完成登录并继续当前操作。