BMG-Q:用于拼车订单调度的局部二分匹配图注意力Q学习
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本研究提出了一种新的多智能体强化学习算法框架BMG-Q,优化了拼车订单调度决策。实验结果显示,该方法的累计奖励比基准框架高出约10%,并有效降低了代理的过估计偏差超过50%。
🎯
关键要点
- 本研究提出了一种新的多智能体强化学习算法框架BMG-Q,优化拼车订单调度决策。
- BMG-Q基于局部二分匹配图,解决了拼车订单调度中决策过程的效率低下问题。
- 该方法引入了图注意力双深度Q网络(GATDDQN),优化状态信息和订单匹配策略。
- 实验结果显示,BMG-Q的累计奖励比基准框架高出约10%。
- BMG-Q有效降低了代理的过估计偏差超过50%。
➡️