单峰赌博机中的最佳臂识别
原文中文,约300字,阅读约需1分钟。发表于: 。本文研究了单峰赌博机中固定置信度的最佳臂识别问题,揭示了算法的停止时间存在的两个下限。研究提出的Track-and-Stop和Top Two算法利用了单峰结构,其中Track-and-Stop在单参数指数族中是渐近最优的,而Top Two在高斯分布中表现接近最优,具有非渐近保证,显示出良好的实际应用性能。
本文研究了单峰赌博机中固定置信度的最佳臂识别问题,提出了Track-and-Stop和Top Two算法,并揭示了算法停止时间的两个下限,显示出良好的实际应用性能。