ADAM 在非凸背景下的常数步长收敛性:一个简单的证明

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了Adam算法的连续时间版本及新的步长递减Adam算法,证明了它们在稳定性条件下能够收敛于目标函数的临界点,并具有收敛性。

🎯

关键要点

  • 介绍了 Adam 算法的连续时间版本。

  • 证明了在稳定性条件下,Adam 算法能够收敛于目标函数的临界点。

  • 介绍了一种新的步长递减 Adam 算法。

  • 分析了新的步长递减 Adam 算法的波动性。

  • 采用条件中心极限定理证明了算法的收敛性。

➡️

继续阅读