本研究探讨了随机线性臂问题,研究了稀疏遗憾界在未知系数数目和对手生成动作集的情况下的应用。通过在线转换为置信区间,并结合层级置信区间随机模型选择方法,提出了一种新颖的技术。实验证明,该方法在提高随机线性臂问题的性能方面具有潜力。
完成下面两步后,将自动完成登录并继续当前操作。