小红花·文摘

本研究提出了一种新型加权方案和子空间动量，以提高有限通信条件下分布式深度学习的梯度聚合效率，实验结果表明其优于传统方法。

Adaptive Consensus Gradient Aggregation for Large-Scale Distributed Training

BriefGPT - AI 论文速递 ·

本文研究了分布式深度学习的多种方法，包括联邦学习、分离式学习和大批量随机梯度下降等，以及差分隐私、同态加密、遗忘传输和混淆电路等安全方法。讨论了它们的优缺点和未来趋势。

分散系统中 AI 推理的完全安全性和隐私

BriefGPT - AI 论文速递 ·

该论文介绍了一种新的分布式深度学习方法，利用双向传递策略提高神经网络的训练效率。分析了该方法在分布式计算中的有效性，展示了其作为分布式深度学习系统中的变革性工具的潜力。

前向学习中新兴的 NeoHebbian 动态：对神经形态计算的意义

BriefGPT - AI 论文速递 ·

自适应前向网络的资源高效医学图像分析

BriefGPT - AI 论文速递 ·

该论文介绍了一种新的分布式深度学习方法，利用Geoffrey Hinton的Forward-Forward（FF）算法增强神经网络训练。该方法采用双向传递策略进行前向传递，提供更有效和符合生物学原理的神经网络训练方法。研究重点关注FF算法在分布式环境中的实现，以减少训练时间和资源消耗。该方法有潜力成为分布式深度学习系统中的变革性工具，提高训练效率。

FFCL：前馈 - 前馈神经网络与皮层回路，边缘上的训练与推理，无需反向传播

BriefGPT - AI 论文速递 ·

本文介绍了一种在时间受限环境下的分布式深度学习模型训练的新算法，通过加权平均推动工作节点接近计算得出的中心变量，以优先恢复优化景观中的平坦区域。实验证明该算法具有更快的收敛速度和恢复更好的质量和平坦的局部最优解。同时，该算法在更拥挤的分布式训练环境中具有可扩展性，并且需要较少的通信频率和分布式更新。

分布式学习遇上图结构采样

BriefGPT - AI 论文速递 ·

大规模语言模型的贝叶斯低秩自适应的高斯随机权重平均化

BriefGPT - AI 论文速递 ·

该研究提出了一种在时间受限环境下的分布式深度学习模型训练算法，通过加权平均推动工作节点接近计算得出的中心变量，以优先恢复平坦区域。实验证明该算法收敛速度更快，质量更好，且需要较少的通信频率和分布式更新。

GRAWA：基于梯度的加权平均方法用于分布式训练深度学习模型

BriefGPT - AI 论文速递 ·

该研究提出了一种名为adaComp的新算法，结合了梯度选择和学习率调节，在分布式深度学习计算中实现了worker更新模型数据压缩。在模拟平台上嵌入TensorFlow到Linux容器中进行实验，相对于标准异步随机梯度下降，保持模型精度的同时，将工人发送到服务器的总数据量减少了两个数量级。例如，在MNIST数据集上的卷积网络中，减少了191倍。

通过协同计算内存网络中的频域压缩在边缘处控制模拟数据洪水

BriefGPT - AI 论文速递 ·

TePDist是阿里云PAI团队自研的全自动分布式深度学习系统，采用Client/Server分离架构，以HLO IR作为Server端输入，具有特色的流水线并行规划，能够提供基本相当的性能。后续计划定期优化TePDist系统，并完成产品化工作。

阿里云机器学习PAI发布基于HLO的全自动分布式系统 TePDist，并宣布开源！

阿里云云栖号 ·

Databricks上的PyTorch——介绍Spark PyTorch分发器

Databricks ·