一个系数让 SVRG 生效

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

通过调整乘法系数来控制SVRG强度,并线性衰减该系数,研究表明SVRG可优化深层网络,随训练减弱。新方法alpha-SVRG在实验中优于基准,有助于深度学习方差减少技术研究。

🎯

关键要点

  • 通过引入乘法系数控制SVRG强度,并线性衰减该系数。
  • 研究表明SVRG可优化深层网络,且随着训练减弱。
  • 新方法alpha-SVRG在实验中优于基准方法。
  • alpha-SVRG在训练损失方面能够更好地优化神经网络。
  • 希望鼓励进一步探索深度学习中的方差减少技术。
➡️

继续阅读