无悔的 M${}^{atural}$ 凹函数最大化:随机赌博算法和对抗完全信息设置的 NP 困难性

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文研究了一种在线优化过程,其中目标函数属于广泛的连续次模函数类。提出了一种Frank-Wolfe算法的变体,对未来最佳可行解具有O(T的平方根)的遗憾界。对于只能获得梯度的无偏估计的情况,提出了在线随机梯度上升算法,对未来最佳可行解的近似度为1/2。将结果推广到γ-弱次模函数,并证明相同的次线性遗憾界。演示了算法在几个问题实例上的效率。

🎯

关键要点

  • 研究在线优化过程,目标函数属于连续次模函数类。
  • 提出Frank-Wolfe算法变体,具有O(T的平方根)的遗憾界。
  • 算法对未来最佳可行解的近似度为(1-1/e)。
  • 提出在线随机梯度上升算法,适用于无偏估计,遗憾界为O(T的平方根),近似度为1/2。
  • 结果推广到γ-弱次模函数,证明相同的次线性遗憾界。
  • 在多个实例上演示算法效率,包括非凸/非凹二次规划等问题。
🏷️

标签

➡️

继续阅读