现代深度神经网络需要分布式训练以解决规模问题,但通信开销成为瓶颈。本文提出了适应性批量大小策略,减小小批量梯度的方差,提供了收敛性保证,并通过实验证明了策略的有效性。
完成下面两步后,将自动完成登录并继续当前操作。