小红花·文摘 - 小红花技术领袖俱乐部

使用torch.compile和梯度累积加速模型训练

使用torch.compile和梯度累积加速模型训练

MachineLearningMastery.com ·

无需增加GPU的三种加速模型训练的方法

无需增加GPU的三种加速模型训练的方法

MachineLearningMastery.com ·

DEFT是一种新颖的梯度稀疏化方案，将梯度选择任务划分为子任务并分配给工作节点，可以减少计算成本和消除梯度累积。实证评估表明，DEFT相对于现有的稀疏化方法在梯度选择的速度方面显示出显著的训练性能改进，同时实现了高收敛性能。

MiCRO：用于扩展和加速分布式 DNN 训练的几乎零成本梯度稀疏化

BriefGPT - AI 论文速递 ·