小红花·文摘

本研究介绍了一种名为DRLSL的新的神经符号模型自由深度强化学习方法，结合了深度强化学习和符号逻辑知识驱动推理，实现了在现实环境下的安全学习和自主驾驶政策。该方法在训练和测试阶段成功避免了不安全的行为，且比传统的深度强化学习方法更具一般性和更快的收敛速度。