小红花·文摘

本文介绍了一种新的深度学习权重平均训练框架——层次权重平均（HWA），该方法结合了在线和离线平均，显著提高了收敛速度和泛化性能。实验结果表明，HWA 优于现有方法，有效解决了传统方法面临的挑战。