基于动量的梯度下降方法在李群上的应用
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文研究了使用Polyak's Heavy-ball方法在约束凸问题中进行深度学习和凸优化的收敛性。通过移动平均策略更新步长,该方法可以获得更好的收敛率。实证结果验证了该方法的改进性能。
🎯
关键要点
- 本文研究了使用Polyak's Heavy-ball方法在约束凸问题中的收敛性。
- 随机梯度下降法通常使用最后一次迭代作为最终解决方案,但存在可用遗憾分析和恒定动量参数设置的问题。
- Polyak's Heavy-ball方法通过移动平均策略更新步长,能够获得O(1 / 根号 T)的最优收敛率。
- 普通SGD的收敛率为O(log T / 根号 T),Polyak's Heavy-ball方法具有更好的性能。
- 新型分析方法阐释了HB动量及其时间变化的作用,并提供了动量参数安排的建议。
- 实证结果验证了收敛分析的正确性,并证明了自适应HB方法的改进性能。
🏷️
标签
➡️