本研究探讨了锐度感知最小化算法(GSAM)在深度神经网络训练中的收敛性。GSAM通过逐步增大批量大小和衰减学习率,更有效地找到平坦的局部最小值,从而提升模型的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。