该研究利用双层马尔可夫决策过程(MDP)框架,提高科学任务的自主规划能力。此方法能快速计算决策,适应计划延误或偏差。通过转化为双层MDP,增强AI解决方案的可解释性和可信度,并在RoverGridWorld环境中测试,展示了计算处理能力和近似最佳策略,强调计算时间与策略最优性之间的权衡。
该研究利用双层马尔可夫决策过程(MDP)框架,提高科学任务的自主规划效率。此方法能快速计算决策,处理任务延误或偏差。通过将任务规划转化为双层MDP,增强了AI解决方案的可解释性。在RoverGridWorld环境测试中,展示了计算处理能力和近似最佳策略,并强调了计算时间与策略最优性之间的权衡。
完成下面两步后,将自动完成登录并继续当前操作。