小红花·文摘

自动微分在深度学习中利用链式法则计算梯度，涉及雅可比矩阵和向量-雅可比积。正向模式和反向模式分别从前向和后向计算雅可比矩阵乘积，以优化存储和计算复杂度。

自动微分再探

Lei Mao's Log Book ·

本文直观地阐述了多变量链式法则，基于雅可比矩阵的矩阵乘法，统一了一元与多元链式法则。通过示例展示了线性和二次函数的梯度及最小二乘问题的优化，强调了链式法则在数学中的广泛应用。

链式法则

Lei Mao's Log Book ·

导数是描述函数输入变化时输出变化的基本概念，主要包括普通导数、偏导数、方向导数和全导数。导数通过极限定义，适用于标量和向量值函数。偏导数用于多变量函数，方向导数测量特定方向的变化，全导数则是各偏导数的组合，通常用雅可比矩阵表示。

导数

Lei Mao's Log Book ·

本研究提出了一种新方法，通过将目标语义区域的雅可比矩阵投影到低维子空间，实现精确的语义发现与局部控制，无需额外训练。实验结果表明，该方法在多个数据集上表现优异，尤其在特定人脸属性编辑中超越了监督学习。

基于无监督区域的去噪扩散模型图像编辑

BriefGPT - AI 论文速递 ·

本文研究了深度神经网络输入输出雅可比矩阵的奇异值分布，分析了深度、权重初始化与非线性性之间的关系。结果表明，ReLU网络无法实现动态等距，而Sigmoid网络需要正交权重初始化才能实现等距，且学习效率更高。此外，提出了一种新的初始化方案以解决LSTMs和GRUs的训练不稳定性，并探讨了神经网络初始化的尺度问题及其对模型构建的重要性。