在线学习弱耦合的 MDP 策略用于负载均衡和自动缩放 原文中文,约300字,阅读约需1分钟。发表于:2024-06-20T00:00:00Z。 该研究介绍了一种针对具有突发流量的有限队列的负载均衡和自动缩放的新模型和算法,通过线性规划解决了弱耦合的马尔可夫决策过程问题,进一步将其放松为可操作的松弛线性规划,并基于线性规划的拉格朗日函数提出了一个两时间尺度算法来解决在线参数学习和策略优化的问题。 该研究提出了一种针对具有突发流量的有限队列的负载均衡和自动缩放的新模型和算法。通过线性规划解决了弱耦合的马尔可夫决策过程问题,并提出了一个两时间尺度算法来解决在线参数学习和策略优化的问题。 在线参数学习 线性规划 自动缩放 负载均衡 马尔可夫决策过程