小红花·文摘

深度学习中，增加神经网络大小可以提高模型质量，但也增加了内存和计算需求。使用低精度数值的效率技术可以降低硬件成本。本文通过度量驱动的方法选择数值，展示了该方法如何帮助扩展语言表示模型的训练，并可推广到其他模型架构。