学习带约束优化的深度增广 Lagrangian 方法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
LODO是一种新的机器学习优化器,将学习优化技术与拟牛顿方法相结合,用于学习对称矩阵向量积的神经表示。该方法不需要元训练,并在噪声中表现良好。实验结果显示,LODO在训练深度神经网络方面具有竞争力。
🎯
关键要点
-
LODO是一种新的机器学习优化器,结合了学习优化技术与拟牛顿方法。
-
LODO用于学习对称矩阵向量积的神经表示,适应测试任务中的损失景观局部特征。
-
与其他L2O方法不同,LODO不需要在训练任务分布上进行元训练。
-
LODO在噪声中表现良好,能够表示广泛的逆Hessian。
-
实验表明,简单的替代方法会导致性能下降。
-
使用LODO优化器训练的95k参数的深度神经网络获得了与标准优化器竞争的结果。
➡️