小红花·文摘

该研究提出了一种神经符号强化学习框架，通过简化视觉模型和学习结构化状态和符号策略，实现了在九个 Atari 任务中的显著性能提升。同时，该方法还能生成简明易读的策略和决策解释。