研究表明,小奖励的方差可以改善赌博问题中的遗憾界限。疏离维度在方差相关界限中很重要,方差信息在特定条件下能显著提升算法表现。
本文介绍了一种新型无投影算法用于在线凸优化,具有领先的遗憾保证。其遗憾界限为$ ilde{O}( ext{sqrt}(dT) + ext{kappa} d)$,主要项不受可行集非球面率$ ext{kappa}$影响,克服了传统方法的局限性,并在约束随机凸优化中实现了更快的收敛速度。
研究了在线二分类问题中的策略性代理修改可观测特征以实现积极分类的问题。通过特征空间上的有向图模拟可行的操纵集,并引入了战略Littlestone维度来捕捉假设类和操纵图的联合复杂性。实现了改进的遗憾。放宽了学习者知道操纵图的假设,而是假设他们的知识由图族来表示。得出了在所有代理按照图族中的同一图进行操纵的可实现设置和选择性地建模为图系的对抗选择性设置中的遗憾界限。
完成下面两步后,将自动完成登录并继续当前操作。