神经网络可行的无鞍牛顿优化的 Hessian-Vector 乘积系列

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提出了一种适用于高维度优化问题的算法,结合了随机梯度下降和拟牛顿法,通过维护和操作每个贡献函数的独立 Hessian 近似值实现不同的方法的统一。该算法在七个不同的优化问题上进行了实验性的改进收敛表现,已发布为开源 Python 和 MATLAB 软件包。

🎯

关键要点

  • 该研究提出了一种结合随机梯度下降和拟牛顿法的算法。
  • 算法通过维护和操作每个贡献函数的独立 Hessian 近似值实现不同方法的统一。
  • 该算法适用于高维度优化问题,保持计算可行性并限制内存需求。
  • 算法需要很少或不需要调整超参数。
  • 与早期随机二阶技术不同,该算法不将每个贡献函数的 Hessian 视为完整 Hessian 的噪声近似。
  • 在七个不同的优化问题上进行了实验,显示出改进的收敛表现。
  • 算法已发布为开源 Python 和 MATLAB 软件包。
➡️

继续阅读