梯度正则化牛顿法最小化准自协调函数

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提出了一种算法,结合了随机梯度下降和拟牛顿法,通过维护和操作每个贡献函数的独立 Hessian 近似值实现不同方法的统一。该算法适用于高维度优化问题,通过在共享的低维度子空间中存储和操作这些二次近似值,保持了计算可行性和限制了内存需求。实验结果表明该算法在七个不同的优化问题上有改进收敛表现,已发布为开源软件包。

🎯

关键要点

  • 该研究提出了一种结合随机梯度下降和拟牛顿法的算法。
  • 算法通过维护和操作每个贡献函数的独立 Hessian 近似值实现不同方法的统一。
  • 适用于高维度优化问题,存储和操作二次近似值在共享的低维度子空间中。
  • 保持计算可行性,限制内存需求,且需要很少或不需要调整超参数。
  • 与早期随机二阶技术不同,该算法不将每个贡献函数的 Hessian 视为完整 Hessian 的噪声近似。
  • 在七个不同的优化问题上进行了实验,显示出改进的收敛表现。
  • 算法已发布为开源 Python 和 MATLAB 软件包。
➡️

继续阅读