小红花·文摘

本文讨论在线线性优化问题，提出了一种新算法框架，结合学习与决策，实现了O(T^{1/3})的遗憾值。研究了分批处理方法对运营性能的影响，分析了遗憾值的上下界，并提出了针对多资源分配的算法体系，应用于在线拍卖和广告策略等领域。

BriefGPT - AI 论文速递 ·

本文研究了在线线性优化问题，提出了多种算法以最小化后悔量，包括基于Bregman投影的梯度下降策略和Maximin-LUCB策略。同时探讨了模仿学习中的偏好反馈优势，并提出了基于上置信界的算法，实验证明其优于传统方法。

BriefGPT - AI 论文速递 ·