本文研究了高速客运铁路的动态定价策略,提出了一种基于非零和马尔可夫博弈的多智能体强化学习框架。研究结果表明,用户偏好和定价政策对乘客选择及系统动态具有重要影响,为铁路定价策略的发展奠定了基础。
完成下面两步后,将自动完成登录并继续当前操作。