BMG-Q:用于拼车订单调度的局部二分匹配图注意力Q学习

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本研究提出了一种新的多智能体强化学习算法框架BMG-Q,优化了拼车订单调度决策。实验结果显示,该方法的累计奖励比基准框架高出约10%,并有效降低了代理的过估计偏差超过50%。

🎯

关键要点

  • 本研究提出了一种新的多智能体强化学习算法框架BMG-Q,优化拼车订单调度决策。
  • BMG-Q基于局部二分匹配图,解决了拼车订单调度中决策过程的效率低下问题。
  • 该方法引入了图注意力双深度Q网络(GATDDQN),优化状态信息和订单匹配策略。
  • 实验结果显示,BMG-Q的累计奖励比基准框架高出约10%。
  • BMG-Q有效降低了代理的过估计偏差超过50%。
➡️

继续阅读