带 Massart 噪声的半空间在线学习

在存在 Massart 噪声的在线学习任务中，我们研究了广义线性分类器的基本类，并提出了一个高效的算法，达到了错误界限，与在线对手对抗。我们还将在线学习模型扩展到 k 臂上下文强盗设置中，通过使用我们的 Massart 在线学习器设计了一个高效的强盗算法，从而达到至少比在每一轮随机选择一个动作大 (1-1/k)~Delta T - o (T) 的期望奖励。

研究人员探讨了在线学习任务中存在Massart噪声的广义线性分类器的基本类，并提出了一个高效的算法来对抗在线对手。他们还将在线学习模型扩展到k臂上下文强盗设置中，并设计了一个高效的强盗算法，通过使用Massart在线学习器，达到了至少比每轮随机选择一个动作大(1-1/k)~Delta T - o(T)的期望奖励。

Massart噪声 k臂上下文强盗在线学习广义线性分类器算法