本文介绍了一种在时间受限环境下的分布式深度学习模型训练的新算法,通过加权平均推动工作节点接近计算得出的中心变量,以优先恢复优化景观中的平坦区域。实验证明该算法具有更快的收敛速度和恢复更好的质量和平坦的局部最优解。同时,该算法在更拥挤的分布式训练环境中具有可扩展性,并且需要较少的通信频率和分布式更新。
完成下面两步后,将自动完成登录并继续当前操作。