本研究提出了一种新的认知信念驱动Q学习方法,通过主观信念建模提升代理的学习和推理能力,优化决策策略,增强适应性和鲁棒性,优于传统Q学习算法。
本研究提出了一种新的认知信念驱动Q学习方法(CBDQ)。
CBDQ方法旨在解决强化学习在决策准确性和历史学习经验利用方面的不足。
该方法通过引入主观信念建模,提升代理的学习和推理能力。
CBDQ优化了决策策略,提高了适应性与鲁棒性。
研究结果显示CBDQ在性能上优于传统Q学习算法。
完成下面两步后,将自动完成登录并继续当前操作。