神经网络可行的无鞍牛顿优化的 Hessian-Vector 乘积系列
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了一种适用于高维度优化问题的算法,结合了随机梯度下降和拟牛顿法,通过维护和操作每个贡献函数的独立 Hessian 近似值实现不同的方法的统一。该算法在七个不同的优化问题上进行了实验性的改进收敛表现,已发布为开源 Python 和 MATLAB 软件包。
🎯
关键要点
- 该研究提出了一种结合随机梯度下降和拟牛顿法的算法。
- 算法通过维护和操作每个贡献函数的独立 Hessian 近似值实现不同方法的统一。
- 该算法适用于高维度优化问题,保持计算可行性并限制内存需求。
- 算法需要很少或不需要调整超参数。
- 与早期随机二阶技术不同,该算法不将每个贡献函数的 Hessian 视为完整 Hessian 的噪声近似。
- 在七个不同的优化问题上进行了实验,显示出改进的收敛表现。
- 算法已发布为开源 Python 和 MATLAB 软件包。
➡️