Capacity-Aware Planning and Scheduling in Budget-Constrained Monotonic MDPs: A Meta-Reinforcement Learning Approach
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种两步规划方法,旨在解决预算和容量约束下的多组件单调马尔可夫决策过程(MDP)问题。实验结果表明,该方法在提高大型工业机器人群的平均正常运行时间方面优于现有技术。
🎯
关键要点
- 本研究提出了一种两步规划方法,解决预算和容量约束下的多组件单调马尔可夫决策过程(MDP)问题。
- 该方法通过线性和分配问题将组件分组,利用元训练的策略梯度代理获取近似最优策略。
- 实验结果表明,该方法在提升大型工业机器人群的平均正常运行时间方面优于现有技术。
➡️