面临模糊原则的乐观主义在多臂赌博中的应用

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究分析了随机和对抗多臂老虎机问题中扰动算法的最优性。我们统一分析了子Weibull和有界扰动的遗憾,特别是次高斯分布的收益。对于参数为2的子Weibull扰动,我们提供了实例最优界限。在对抗设置中,利用离散选择和极值理论,证明了两种解决方法的障碍。结果表明,最优扰动若存在,则为Frechet类型。

🎯

关键要点

  • 本研究探讨了随机和对抗多臂老虎机问题中基于扰动的算法的最优性。
  • 提供了对子Weibull和有界扰动的统一遗憾分析,特别是在收益为次高斯分布时。
  • 对于参数为2的子Weibull扰动,提供了实例最优界限和匹配的下支界。
  • 对于所有在支持的极端点处有足够概率质量的有界扰动,提供了实例最优边界。
  • 在对抗设置中,使用离散选择理论和极值理论证明了两种解决方法的严格障碍。
  • 结果表明,如果最优扰动存在,则将是Frechet类型的。
➡️

继续阅读