基于先验的分配策略在结构化赌博机中进行贝叶斯固定预算最佳臂识别
原文中文,约400字,阅读约需1分钟。发表于: 。我们研究了基于贝叶斯的固定预算最佳臂识别(BAI)在结构化赌博问题中的应用,提出了一种算法,该算法基于先前的信息和环境的结构使用固定分配,我们对该算法在各种模型上的性能给出了理论上的界限,包括首次基于先验信息的线性和分层 BAI 的上界。我们的主要贡献是引入了新的证明方法,相比现有方法,该方法对多臂 BAI 的界限更紧。我们广泛比较了我们的方法与其他固定预算 BAI...
本文研究了基于贝叶斯的固定预算最佳臂识别(BAI)在结构化赌博问题中的应用,并提出了一种算法。通过与其他方法的比较,证明了该算法在各种场景下具有一致且稳健的性能。该研究提升了对基于贝叶斯的固定预算 BAI 的理解,并突显了其在实际场景中的有效性。