本研究探讨了在固定领域中,利用强化学习合成启发式指导以提升时间规划者的性能。提出了一种新框架,强调在学习和规划阶段结合符号启发式信息,研究结果表明平衡系统搜索与学习信息能够显著推动研究进展。
完成下面两步后,将自动完成登录并继续当前操作。