本研究分析了随机和对抗多臂老虎机问题中扰动算法的最优性。我们统一分析了子Weibull和有界扰动的遗憾,特别是次高斯分布的收益。对于参数为2的子Weibull扰动,我们提供了实例最优界限。在对抗设置中,利用离散选择和极值理论,证明了两种解决方法的障碍。结果表明,最优扰动若存在,则为Frechet类型。
完成下面两步后,将自动完成登录并继续当前操作。