小红花·文摘

本文介绍了一种新颖的组合性随机贪婪的赌博算法（SGB），用于解决多臂赌博问题。该算法通过观察每个时间步选择的一组臂的联合奖励，采用了优化的随机探索再确认的方法。实验证明，该算法在单调随机次模性奖励下，能够实现(1-1/e)的遗憾边界，并且在基数约束方面优于最先进的方法。同时，在在线受限社交影响最大化的背景下，该算法始终优于其他算法，并且随着基数的增长，性能差距也增大。