本文研究虚拟功能部署问题,提出了一种基于多臂强盗理论的新算法。结果表明,该算法能快速学习最优部署策略,并在满足约束条件下,后悔值增长速率为$O( N M \\sqrt{T\ln T} )$,具有良好的实用性能和适度的计算复杂性。
完成下面两步后,将自动完成登录并继续当前操作。