小红花·文摘 - 小红花技术领袖俱乐部

本文介绍了机器学习中自动微分的实现方法，通过将复杂函数拆解为基本运算构建计算图，以精确高效地计算导数。文章还展示了反向传播、梯度更新及优化器的实现，并提供了一个类似PyTorch的开源框架。

自動微分 | DIY 實現自己的 PyTorch

Louis Aeilot's Blog ·

本研究提出了一种新方法，通过分离训练阶段提高深度强化学习的样本效率，结合Dropout Q-Functions算法，减少梯度更新次数，从而降低计算成本和训练时间。

Stabilization Phase of Effective Q-Learning in High Update-Data Ratio Reinforcement Learning

BriefGPT - AI 论文速递 ·

协作学习是一种分布式学习框架，通过共享梯度更新保护用户隐私。提出了双梯度修剪（DGP）方法，提高通信效率和保护协作学习的效用和隐私。实验证明，DGP能有效抵御梯度反演攻击并降低通信成本。

重审梯度修剪：一种用于抵御梯度攻击的双重实现

BriefGPT - AI 论文速递 ·