针对药品供应链中易腐性和非平稳性的经典与深度强化学习库存控制政策研究
📝
内容提要
本研究解决了药品供应链中的库存控制问题,面临易腐性、产量不确定性及非平稳需求等挑战,并结合了批量约束、交货时间和销售损失。通过与百时美施贵宝合作,我们开发了一个现实案例,评估了三种政策,包括传统的补货政策和基于深度强化学习的决策方法,结果表明,尽管深度强化学习有其潜力,但在某些情况下无法超越传统政策,强调了整合多种政策以应对药品供应链挑战的必要性。
➡️