本研究探讨了多臂老虎机环境中的最佳臂识别问题,提出了一种新算法,利用“代理比例”方法优化识别时间,避免复杂计算。该算法被证明是渐近最优,并通过实证研究验证了其效率。
完成下面两步后,将自动完成登录并继续当前操作。