带 Massart 噪声的半空间在线学习

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

研究人员探讨了在线学习任务中存在Massart噪声的广义线性分类器的基本类,并提出了一个高效的算法来对抗在线对手。他们还将在线学习模型扩展到k臂上下文强盗设置中,并设计了一个高效的强盗算法,通过使用Massart在线学习器,达到了至少比每轮随机选择一个动作大(1-1/k)~Delta T - o(T)的期望奖励。

🎯

关键要点

  • 研究了在线学习任务中存在Massart噪声的广义线性分类器的基本类。

  • 提出了一个高效的算法来对抗在线对手,达到了错误界限。

  • 将在线学习模型扩展到k臂上下文强盗设置中。

  • 设计了一个高效的强盗算法,使用Massart在线学习器。

  • 该算法的期望奖励至少比每轮随机选择一个动作大(1-1/k)~Delta T - o(T)。

➡️

继续阅读