具有固定置信度的不安定赌博机中的最佳臂标识
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究了固定置信度下的最佳武器识别问题,提出了一种简单的算法,采样复杂度与已知的特定实例下界匹配,在几乎必然的情况下一致性和期望上。该算法使用的停止规则不依赖于武器数量。实验结果表明,该算法明显优于现有算法。同时,本文还对具有连续武器集的线性武装的最佳武器识别问题进行了首次分析。
🎯
关键要点
-
研究了固定置信度下的最佳武器识别问题。
-
提出了一种简单的算法,采样复杂度与已知的特定实例下界匹配。
-
算法的停止规则不依赖于武器数量。
-
实验结果表明该算法明显优于现有算法。
-
首次分析了具有连续武器集的线性武装的最佳武器识别问题。
➡️