小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

神经网络通过前向传播、损失计算、反向传播和梯度下降进行训练。每个神经元执行线性打分和非线性激活,多个神经元组成层,层与层之间的非线性使网络能够拟合复杂函数。递归神经网络(RNN)通过引入状态,克服了多层感知器(MLP)在序列任务中的局限性。训练过程是参数在损失曲面上逐步优化的过程。

【Transformer 与注意力机制】08.5 神经网络基础:从 MLP 到 RNN 的最后一块地基

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-10T00:00:00Z

本文介绍了机器学习中自动微分的实现方法,通过将复杂函数拆解为基本运算构建计算图,以精确高效地计算导数。文章还展示了反向传播、梯度更新及优化器的实现,并提供了一个类似PyTorch的开源框架。

自動微分 | DIY 實現自己的 PyTorch

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-12T23:45:09Z

本文详细解析了Softmax损失的数学推导,重点在于线性分类器的梯度计算。通过前向传播和反向传播,推导出损失对logits、权重和偏置的梯度,并利用链式法则简化矩阵运算,帮助理解分类网络如何从错误中学习。

揭开Softmax损失的神秘面纱:线性分类器的逐步推导

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-03-28T23:45:09Z

反向传播的主要目标是计算网络中每个权重和偏置的成本函数偏导数。通过矩阵形式简化推导,定义了激活向量、加权输入向量、权重矩阵和偏置向量等符号。推导过程包括输出层误差、隐藏层误差传播,以及偏置和权重的梯度计算,最终形成误差向量与输入激活向量的外积。

反向传播:向量微积分视角

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T22:45:09Z

反向传播的主要目标是计算网络中每个权重和偏置的成本函数的偏导数。通过链式法则和矩阵微积分,推导出输出层和隐藏层的误差传播公式,以及对偏置和权重的梯度计算。最终,偏置的梯度等于误差向量,权重的梯度为误差向量与输入激活向量的外积。

反向传播:向量微积分视角

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T22:45:09Z

本文介绍了神经网络的结构,包括输入层、输出层和多个隐藏层,并使用激活函数(如ReLU)引入非线性。反向传播通过计算梯度和链式法则,将误差从输出层向后传播以学习参数。

CS231n 讲义 IV:神经网络与反向传播

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T20:45:09Z

本文介绍了神经网络及其反向传播算法。神经网络由输入层、输出层和多个隐藏层组成,使用激活函数(如ReLU)引入非线性。反向传播通过计算梯度优化网络参数,利用链式法则将误差从输出层传递到隐藏层。

CS231n 讲义 IV:神经网络与反向传播

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T20:45:09Z
小猫都能懂的大模型原理 4 - 大语言模型架构

文章介绍了大语言模型的结构与训练过程。模型利用注意力机制和前馈神经网络处理数据,通过归一化和残差连接提升稳定性。训练时,模型通过反向传播调整参数,采用梯度下降算法和批量训练优化性能。尽管不同模型实现各异,但均表明语言可用数学方法处理。

小猫都能懂的大模型原理 4 - 大语言模型架构

UsubeniFantasy
UsubeniFantasy · 2025-12-04T02:16:52Z
资源受限移动设备上大型语言模型的内存高效反向传播微调

本文提出了一种内存高效的反向传播方法(MeBP),用于在资源受限的移动设备上微调大型语言模型(LLMs)。MeBP在内存使用和计算时间之间提供了更好的平衡,收敛速度更快,性能优于零阶优化(ZO)基线。实验证明,MeBP在iPhone 15 Pro Max上可实现对0.5B至4B参数的LLMs微调,内存消耗低于1GB。

资源受限移动设备上大型语言模型的内存高效反向传播微调

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-27T00:00:00Z

本文提出随机变分传播(SVP),克服反向传播的局限性。SVP通过将层激活视为潜在变量,实现局部更新与全局一致性,显著降低内存使用,并在多个模型和数据集上达到与反向传播相当的准确性。

随机变分传播:局部、可扩展且高效的反向传播替代方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本文探讨了生成性人工智能的训练与推理过程。训练通过前向传播和反向传播优化模型,类似于人脑的学习方式;推理则利用训练阶段获得的知识处理未标记数据,生成准确的输出。训练与推理相辅相成,提升人工智能的智能化和有效性。

训练与推理:终极联盟

KDnuggets
KDnuggets · 2025-04-03T14:00:10Z
🚀 使用NumPy从零开始构建神经网络 🤖

本文介绍了如何从零开始使用NumPy构建神经网络,深入理解深度学习模型的数学基础、前向和反向传播、激活函数、权重更新及梯度下降等原理。

🚀 使用NumPy从零开始构建神经网络 🤖

DEV Community
DEV Community · 2025-03-14T17:52:18Z

本研究探讨了代数模型计数在学习中的应用,特别是在统计关系和神经符号AI领域。通过推广半环视角,整合多种学习算法,提升反向传播的内存效率,实验结果表明代数反向传播在速度上优于现有方法。

The Gradient of Algebraic Model Counting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-25T00:00:00Z
微梯度中的神经元建模(卡尔帕提解释)

Shrijith Venkatrama正在开发LiveAPI工具,以简化API文档的生成。文章介绍了神经元模型的组成,包括输入、权重、偏置和激活函数tanh的实现,并展示了导数计算和反向传播的过程。

微梯度中的神经元建模(卡尔帕提解释)

DEV Community
DEV Community · 2025-02-16T16:38:44Z
从零开始解锁神经网络的力量!

神经网络是现代人工智能的核心,理解其原理至关重要。本文从零开始介绍神经网络的构建,包括前向传播、反向传播和损失计算的简单解释,并提供使用Python和NumPy的完整实例,帮助读者掌握AI基础,增强使用高级工具的信心。

从零开始解锁神经网络的力量!

DEV Community
DEV Community · 2025-02-16T15:43:12Z
反向传播详解 - 卡尔帕西的解释

Shrijith Venkatrama正在开发LiveAPI工具,以简化API文档的生成。文章介绍了如何通过Python类Value实现图形可视化和反向传播,包括节点标签、梯度计算和链式法则的应用。

反向传播详解 - 卡尔帕西的解释

DEV Community
DEV Community · 2025-02-15T16:38:28Z
从零开始理解反向传播与micrograd - 导数

Shrijith Venkatrama创建的LiveAPI工具简化了API文档生成。文章分析了Andrej Karpathy的micrograd,阐述了神经网络的基本概念,重点讨论导数及其计算方法,解释了反向传播、符号与计算微分的区别,以及输入变化对输出的影响。通过简单的Python代码,读者将理解梯度如何推动神经网络的学习。

从零开始理解反向传播与micrograd - 导数

DEV Community
DEV Community · 2025-02-13T16:43:50Z

本研究提出TESS,旨在解决脉冲神经网络在资源有限设备上训练时的高计算和内存需求问题。TESS基于生物机制,采用时空局部学习规则,使计算和内存开销与神经元数量线性相关,性能接近传统反向传播算法,适合边缘设备的高效学习。

TESS: A Scalable Spatiotemporal Local Learning Rule for Spiking Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本研究提出了一种新颖的分层Kolmogorov-Arnold网络(HKAN)架构,解决了现有KAN依赖反向传播的问题。HKAN通过随机学习优化参数,采用线性回归简化计算,展现出与KAN相当或更优的准确性和稳定性。

无反向传播的分层Kolmogorov-Arnold网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-30T00:00:00Z

本研究提出了一种新训练方法,解决神经网络层宽度选择问题,允许在训练过程中自适应调整层宽度,通过反向传播优化宽度与参数,实现性能与计算资源的平衡。

自适应宽度神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码