基于径向基函数的多层次库存管理深度 Q 网络

原文约300字,阅读约需1分钟。发表于:

本文通过进行一系列模拟实验,证明了基于径向基函数的深度强化学习模型在多层次库存管理问题中的卓越性能,相较于传统基于神经网络的深度强化学习模型,该模型更易于构建,减轻超参数调优的计算负担,并在多层次系统中产生了更好的策略,以及在串行系统中具有与基本库存策略相当的竞争性能,同时也超越了目前的深度强化学习方法。

本文通过模拟实验证明了基于径向基函数的深度强化学习模型在多层次库存管理问题中的卓越性能。

相关推荐 去reddit讨论