RMSProp 及其动量扩展的 $O (\frac {\sqrt {d}}{T^{1/4}})$ 收敛速度:在维度上更好的依赖

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该论文研究了维度依赖性对收敛速度的影响,分析了RMSProp及其动量扩展的收敛速度。得出了不需要梯度有界性假设的收敛速度为O(√d/T^(1/4)),其中d为优化变量的维度,T为迭代次数。对于维度极大的问题,收敛速度可以类比于由l1范数测度的SGD的收敛速度O(1/T^(1/4))。

🎯

关键要点

  • 该论文研究了维度依赖性对收敛速度的影响。

  • 分析了RMSProp及其动量扩展的收敛速度。

  • 得出不需要梯度有界性假设的收敛速度为O(√d/T^(1/4))。

  • d为优化变量的维度,T为迭代次数。

  • 对于维度极大的问题,收敛速度类比于SGD的收敛速度O(1/T^(1/4))。

➡️

继续阅读