基于动量的梯度下降方法在李群上的应用

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文研究了使用Polyak's Heavy-ball方法在约束凸问题中进行深度学习和凸优化的收敛性。通过移动平均策略更新步长,该方法可以获得更好的收敛率。实证结果验证了该方法的改进性能。

🎯

关键要点

  • 本文研究了使用Polyak's Heavy-ball方法在约束凸问题中的收敛性。
  • 随机梯度下降法通常使用最后一次迭代作为最终解决方案,但存在可用遗憾分析和恒定动量参数设置的问题。
  • Polyak's Heavy-ball方法通过移动平均策略更新步长,能够获得O(1 / 根号 T)的最优收敛率。
  • 普通SGD的收敛率为O(log T / 根号 T),Polyak's Heavy-ball方法具有更好的性能。
  • 新型分析方法阐释了HB动量及其时间变化的作用,并提供了动量参数安排的建议。
  • 实证结果验证了收敛分析的正确性,并证明了自适应HB方法的改进性能。
🏷️

标签

➡️

继续阅读