小红花·文摘 - 小红花技术领袖俱乐部

本研究提出NDR-QL方法，以解决Q学习收敛速度慢的问题。NDR模型的预测准确率提高了5%，收敛速度比基线快90%。

神经网络驱动的奖励预测作为启发式：推进移动机器人路径规划中的Q学习

BriefGPT - AI 论文速递 ·