本研究比较了休眠多臂赌博机中的拉格朗日指数策略(LIP)与惠特尔指数策略(WIP)的性能。结果表明,LIP在WIP表现不佳时仍能保持良好效果,并显著减少内存需求。此外,研究分析了重启模型的拉格朗日指数,并提供了均匀赌博机的渐近最优性的新证明。
完成下面两步后,将自动完成登录并继续当前操作。