本文研究线性贝叶斯最优化模型中的最优臂选择问题,提出了一种样本分配策略,以识别最优臂并在最小化样本预算的同时提高奖励值。此外,研究探讨了在多臂赌博机中利用局部反馈提升算法性能的有效性,提出的新算法与现有算法进行了比较,展示了其在实际应用中的优势。
完成下面两步后,将自动完成登录并继续当前操作。