该研究提出了一种通用的组合多臂赌博问题框架,探讨了基于触发概率的算法,旨在最小化遗憾。实验结果表明,新算法在合成和真实数据集上表现优越,适用于在线学习和广告场景。
完成下面两步后,将自动完成登录并继续当前操作。