本研究提出了一种名为SymDQN的模块化方法,旨在解决深度神经网络强化学习中的符号控制问题。实验结果表明,SymDQN显著提升了学习效果和代理行为的一致性。
完成下面两步后,将自动完成登录并继续当前操作。