快速和遗憾最优的最佳臂识别:基本限制和低复杂度算法

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究了固定置信度下的最佳武器识别问题,提出了一种简单的算法,采样复杂度与已知实例下界匹配。算法依赖于跟踪最佳比例的武器采样规则,且停止规则不依赖于武器数量。实验结果表明,算法优于现有算法。同时,对具有连续武器集的线性武装的最佳武器识别问题进行了首次分析。

🎯

关键要点

  • 研究固定置信度下的最佳武器识别问题。

  • 提出了一种简单的算法,采样复杂度与已知实例下界匹配。

  • 算法依赖于跟踪最佳比例的武器采样规则,停止规则不依赖于武器数量。

  • 实验结果表明,算法优于现有算法。

  • 首次分析具有连续武器集的线性武装的最佳武器识别问题。

➡️

继续阅读