小红花·文摘

最近发布了用Rust编写的轻量级自动微分库ferris-grad。该库具有PyTorch风格的自动求导引擎，核心代码不到1000行，且无外部依赖。实现包括标量计算图、张量操作和神经网络层，支持训练多层感知机和mini GPT。项目灵感来源于Karpathy的micrograd和microgpt，欢迎参与贡献。

1000行Rust实现一个类似pytorch的轻量级自动微分库

Rust.cc ·

本文介绍了机器学习中自动微分的实现方法，通过将复杂函数拆解为基本运算构建计算图，以精确高效地计算导数。文章还展示了反向传播、梯度更新及优化器的实现，并提供了一个类似PyTorch的开源框架。

自動微分 | DIY 實現自己的 PyTorch

Louis Aeilot's Blog ·

Hessian矩阵的计算在优化算法中至关重要。自动微分框架如PyTorch和TensorFlow可用于计算Hessian矩阵，它是函数梯度的Jacobian矩阵。尽管计算Hessian矩阵成本高，但在简单函数和小参数时仍然可行。

通过自动微分计算Hessian矩阵

Lei Mao's Log Book ·

本研究探讨了组合同态自动微分（CHAD）在部分编程语言中的应用，重点关注非终止操作和循环结构的处理。通过引入迭代广泛的索引类别，提出了一种解释迭代的原则性方法，实现了反向模式导数的准确计算，并提供了严谨的范畴语义。

解开迭代的组合同态自动微分

BriefGPT - AI 论文速递 ·

【Rust日报】2025-05-09 Swiftide v0.26.0 发布

Rust.cc ·

自动微分在深度学习中利用链式法则计算梯度，涉及雅可比矩阵和向量-雅可比积。正向模式和反向模式分别从前向和后向计算雅可比矩阵乘积，以优化存储和计算复杂度。

自动微分再探

Lei Mao's Log Book ·

本研究探讨如何利用PyTorch自动微分计算大型语言模型的海森矩阵。研究表明，通过多个向量-海森积样本，可以有效计算海森矩阵的对角线，为理解大型语言模型的行为和结构提供重要资源。

利用PyTorch自动微分计算大型语言模型的困惑度海森矩阵

BriefGPT - AI 论文速递 ·

PyTorch 是一个深度学习框架，张量是其核心数据结构，支持创建、运算、索引、切片和形状操作，具备 GPU 加速和自动微分功能。常用函数包括求和和均值，适合深度学习入门学习。

学习PyTorch 的张量（Tensor）

茜文的博客 ·

本研究提出了一种定制的自动微分管道，解决了基于梯度的突触可塑性在软件实现中的手动衍生问题，支持稀疏和在线实施，具备良好的内存利用率和扩展性。

Truly Sparse and Generalized Gradient-Based Synaptic Plasticity Implementation

BriefGPT - AI 论文速递 ·

Raddy是一个支持稠密和稀疏问题的自动微分系统。Arch是一个智能网关，旨在保护和个性化AI代理，处理提示相关任务，确保安全性和可观察性。

【Rust日报】2025-01-11 Arch - 构建快速、可观察且个性化的 AI 代理

Rust.cc ·

本研究探讨了最佳子集预言机学习集合函数，提出隐式微分方法以降低自动微分的计算开销，并在产品推荐和异常检测中验证了其高效性，显著提升了多个应用场景的效率。

Learning Set Functions through Implicit Differentiation

BriefGPT - AI 论文速递 ·

为什么PyTorch如此受欢迎

The New Stack ·

.ai | PyTorch 中的自动微分 autograd

阿掖山：一个博客 ·

Keras与JAX的比较

KDnuggets ·

自动微分是一种高效计算函数导数的方法，结合了符号和数值微分的优点。它通过构建有向无环图并使用链式法则计算梯度，广泛应用于深度学习库如TensorFlow和PyTorch。JAX是支持自动微分的高性能库，适用于机器学习和科学计算。本文探讨了自动微分在数值相对论中的应用，展示了如何用JAX计算度量张量的导数。