匪徒帕累托集识别:固定预算设置
原文中文,约400字,阅读约需1分钟。发表于: 。我们研究了多目标纯探索问题在多臂赌博模型中的应用。每个臂对应一个未知的多变量分布,目标是识别那些均值不比另一个分布差的分布:帕累托最优集。我们提出并分析了固定预算的帕累托集识别任务的第一个算法。我们提出经验间隙消除(Empirical Gap Elimination),这是一系列算法,结合了对每个臂在帕累托集内外的 “分类难度” 的精确估计和一种通用的消除方案。我们证明了两个特定的实例...
该研究提出了一种固定预算的多目标纯探索问题帕累托集识别算法,名为经验间隙消除。该算法结合了分类难度的精确估计和一种通用的消除方案,能够在预算下以指数速度衰减错误概率。实证研究展示了该算法的良好性能。