GRAWA:基于梯度的加权平均方法用于分布式训练深度学习模型

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该研究提出了一种在时间受限环境下的分布式深度学习模型训练算法,通过加权平均推动工作节点接近计算得出的中心变量,以优先恢复平坦区域。实验证明该算法收敛速度更快,质量更好,且需要较少的通信频率和分布式更新。