Optimal Arm Identification in Unimodal Bandits

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本文研究了单峰赌博机中固定置信度的最佳臂识别问题,提出了Track-and-Stop和Top Two算法,并揭示了算法停止时间的两个下限,显示出良好的实际应用性能。

🎯

关键要点

  • 本文研究了单峰赌博机中固定置信度的最佳臂识别问题。

  • 揭示了算法的停止时间存在的两个下限。

  • 提出了Track-and-Stop和Top Two算法,利用了单峰结构。

  • Track-and-Stop算法在单参数指数族中是渐近最优的。

  • Top Two算法在高斯分布中表现接近最优,具有非渐近保证。

  • 研究显示出良好的实际应用性能。

➡️

继续阅读