现代神经网络结构的克罗内克分解近似曲率

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

K-FAC是一种高效的逆近似方法,用于近似神经网络的Fisher信息矩阵,表现比先前的近似自然梯度/牛顿方法更好。

🎯

关键要点

  • 提出了一种名为 K-FAC 的方法来近似神经网络中的自然梯度下降。
  • K-FAC 基于一种高效的逆近似方法来近似神经网络的 Fisher 信息矩阵。
  • K-FAC 既不是对角线矩阵也不是低秩矩阵。
  • 与先前的近似自然梯度/牛顿方法相比,K-FAC 在高度随机的优化方案中表现更好。
➡️

继续阅读