稀疏线性赌臂机器中的固定预算最佳臂识别

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种简单算法,能够在最小化采样预算的同时确定最佳武器。该算法依赖于跟踪最佳比例的武器采样规则,且停止规则不依赖于武器数量。实验结果表明,该算法明显优于现有算法。同时,本文还对具有连续武器集的线性武装的最佳武器识别问题进行了首次分析。

🎯

关键要点

  • 本文研究了随机线性武装的最佳武器识别问题。

  • 目标是在最小化采样预算的同时确定最佳武器。

  • 设计了一种简单的算法,其采样复杂度与已知的特定实例下界匹配。

  • 该算法依赖于跟踪最佳比例的武器采样规则,且停止规则不依赖于武器数量。

  • 实验结果表明,该算法明显优于现有算法。

  • 本文首次分析了具有连续武器集的线性武装的最佳武器识别问题。

➡️

继续阅读