该研究旨在最大化销售和最小化浪费,通过分布式方法研究杂货店的库存补货问题。研究提出了GLDQN算法,证明其在浪费和总体奖励方面优于其他分布式强化学习算法。
完成下面两步后,将自动完成登录并继续当前操作。