Optimal Arm Identification in Unimodal Bandits
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本文研究了单峰赌博机中固定置信度的最佳臂识别问题,提出了Track-and-Stop和Top Two算法,并揭示了算法停止时间的两个下限,显示出良好的实际应用性能。
🎯
关键要点
-
本文研究了单峰赌博机中固定置信度的最佳臂识别问题。
-
揭示了算法的停止时间存在的两个下限。
-
提出了Track-and-Stop和Top Two算法,利用了单峰结构。
-
Track-and-Stop算法在单参数指数族中是渐近最优的。
-
Top Two算法在高斯分布中表现接近最优,具有非渐近保证。
-
研究显示出良好的实际应用性能。
➡️