从答案集进行在线归纳学习以实现高效的强化学习探索

📝

内容提要

本研究解决了强化学习中训练性能和可解释性不足的问题,提出了一种结合归纳逻辑编程和强化学习的新方法。通过从噪声示例中学习逻辑规则,该方法在每个经验批次中形成了可解释的代理策略近似,显著提高了学习代理的探索效率,并在复杂性增加的环境中表现出优越的训练效果。

🏷️

标签

➡️

继续阅读