该研究提出了一种神经符号强化学习框架,通过简化视觉模型和学习结构化状态和符号策略,实现了在九个 Atari 任务中的显著性能提升。同时,该方法还能生成简明易读的策略和决策解释。
完成下面两步后,将自动完成登录并继续当前操作。