学习带约束优化的深度增广 Lagrangian 方法

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

LODO是一种新的机器学习优化器,将学习优化技术与拟牛顿方法相结合,用于学习对称矩阵向量积的神经表示。该方法不需要元训练,并在噪声中表现良好。实验结果显示,LODO在训练深度神经网络方面具有竞争力。

🎯

关键要点

  • LODO是一种新的机器学习优化器,结合了学习优化技术与拟牛顿方法。

  • LODO用于学习对称矩阵向量积的神经表示,适应测试任务中的损失景观局部特征。

  • 与其他L2O方法不同,LODO不需要在训练任务分布上进行元训练。

  • LODO在噪声中表现良好,能够表示广泛的逆Hessian。

  • 实验表明,简单的替代方法会导致性能下降。

  • 使用LODO优化器训练的95k参数的深度神经网络获得了与标准优化器竞争的结果。

➡️

继续阅读