本研究解决了深度神经网络模型在训练中寻找平坦局部最小值的能力不足的问题。通过理论分析,论文提出了锐度感知最小化算法(GSAM),在使用逐步增大的批量大小或衰减学习率的情况下,GSAM能够更有效地收敛。数值比较表明,使用GSAM方法能够找到更平坦的局部最小值,相比于使用恒定批量大小和学习率的方法。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: