优化最小后悔度的无监督环境设计

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

通过von Neumann最小极大定理研究在线凸优化游戏的最优策略遗憾,证明了遗憾与经验最小化算法的行为密切相关,具有几何解释,可视为Jensen不等式中的差距。给出了在线学习问题的最优策略上下界限制,提供了无需构建学习算法的上界和对抗者的明确最优策略的下界。

🎯

关键要点

  • 通过 von Neumann 最小极大定理研究在线凸优化游戏的最优策略遗憾。
  • 最优策略的遗憾与经验最小化算法的行为密切相关。
  • 遗憾等于最小期望损失的总和与最小经验损失之间的差的最大值。
  • 最优策略的遗憾具有几何解释,可以视为 Jensen 不等式中的差距。
  • 对各种在线学习问题的最优策略给出了上下界限制。
  • 提供了无需构建学习算法的上界和对抗者的明确最优策略的下界。
➡️

继续阅读