Near-Optimal Pure Exploration in Logistic Bandits

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新算法“物流跟踪与停止”(Log-TS),旨在解决广义线性模型老虎机中的纯探索问题。该算法有效接近样本复杂度的期望下界,展示了其在纯探索中的潜在影响。

🎯

关键要点

  • 本研究提出了一种新算法,名为物流跟踪与停止(Log-TS),旨在解决广义线性模型老虎机中的纯探索问题。
  • 该算法能够有效接近样本复杂度的期望下界,展示了其在纯探索中的潜在影响。
  • 尽管在简单的多臂老虎机或线性老虎机中已有一些算法,但在更复杂的设置中,最优算法仍然稀缺。
➡️

继续阅读