SOFIM:使用正则化的费歇尔信息矩阵进行随机优化
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
该论文提出了一种新的随机优化方法SOFIM,用于大规模机器学习模型的优化。SOFIM利用FIM近似Hessian矩阵,类似于Adam方法,解决小批量非定常目标问题。实验结果表明,SOFIM在图像分类数据集上优于带动量的SGD和其他牛顿优化方法。
🎯
关键要点
- 该论文提出了一种新的随机优化方法SOFIM,用于大规模机器学习模型的优化。
- SOFIM利用正则化Fisher信息矩阵(FIM)近似Hessian矩阵,解决存储和计算完整FIM的挑战。
- SOFIM被视为自然梯度下降(NGD)的一种变体,使用正则化FIM和Sherman-Morrison矩阵求解梯度更新方向。
- SOFIM类似于Adam方法,利用梯度的一阶矩解决小批量非定常目标问题。
- 实验结果表明,SOFIM在图像分类数据集上优于带动量的SGD和其他牛顿优化方法,如Nystrom-SGD、L-BFGS和AdaHessian。
➡️