小红花·文摘 - 小红花技术领袖俱乐部

该研究旨在最大化销售和最小化浪费，通过分布式方法研究杂货店的库存补货问题。研究提出了GLDQN算法，证明其在浪费和总体奖励方面优于其他分布式强化学习算法。

学习具有常规库存到货动态的库存控制策略

BriefGPT - AI 论文速递 ·