深入探索神经网络：从基础到应用的全面指南 - 小红花·文摘 - 小红花技术领袖俱乐部

ParaRNN：大规模非线性递归神经网络，可并行训练

ParaRNN：大规模非线性递归神经网络，可并行训练

Apple Machine Learning Research ·

最近发布了用Rust编写的轻量级自动微分库ferris-grad。该库具有PyTorch风格的自动求导引擎，核心代码不到1000行，且无外部依赖。实现包括标量计算图、张量操作和神经网络层，支持训练多层感知机和mini GPT。项目灵感来源于Karpathy的micrograd和microgpt，欢迎参与贡献。

1000行Rust实现一个类似pytorch的轻量级自动微分库

Rust.cc ·

DDPM笔记

DDPM笔记

plus studio ·

从递归神经网络到变换器

从递归神经网络到变换器

Louis Aeilot's Blog ·

递归神经网络（RNN）用于处理序列数据，具备内部状态（记忆），适应多种输入输出结构。RNN通过递归公式更新隐藏状态并生成输出。长短期记忆（LSTM）通过门控机制解决梯度消失问题，增强信息流动。

CS231n 讲义 VII：递归神经网络

Louis Aeilot's Blog ·

【TVM教程】理解 Relax 抽象层

【TVM教程】理解 Relax 抽象层

HyperAI超神经 ·

本文讨论了卷积神经网络（CNN）的架构和训练方法，包括归一化层、正则化（如Dropout）、激活函数（如ReLU和GELU）、残差网络（ResNet）和权重初始化（Kaiming初始化）。还介绍了数据预处理、数据增强、迁移学习策略及超参数优化步骤，强调系统调试的重要性，指出大多数失败源于基本设置问题，而非超参数选择。

CS231n 讲义 VI：卷积神经网络架构与训练

Louis Aeilot's Blog ·

CS231n 讲义 V：卷积神经网络基础

CS231n 讲义 V：卷积神经网络基础

Louis Aeilot's Blog ·

[实验性] 有开发者破解苹果ANE神经网络引擎原来M4芯片也能直接训练小模型

[实验性] 有开发者破解苹果ANE神经网络引擎原来M4芯片也能直接训练小模型

蓝点网 ·

苹果推出搭载M4芯片的新款iPad Air 采用16核神经网络引擎核12GB内存

苹果推出搭载M4芯片的新款iPad Air 采用16核神经网络引擎核12GB内存

蓝点网 ·

解决简街的“掉落的神经网络”难题

Yi's blog ·

本文介绍了神经网络及其反向传播算法。神经网络由输入层、输出层和多个隐藏层组成，使用激活函数（如ReLU）引入非线性。反向传播通过计算梯度优化网络参数，利用链式法则将误差从输出层传递到隐藏层。

CS231n 讲义 IV：神经网络与反向传播

Louis Aeilot's Blog ·

本文介绍了神经网络的结构，包括输入层、输出层和多个隐藏层，并使用激活函数（如ReLU）引入非线性。反向传播通过计算梯度和链式法则，将误差从输出层向后传播以学习参数。

CS231n 讲义 IV：神经网络与反向传播

Louis Aeilot's Blog ·

告别N卡CUDA垄断，Windows+AMD显卡ROCm跑深度学习：手把手实现 MNIST 手写数字识别 - 曦远Code

告别N卡CUDA垄断，Windows+AMD显卡ROCm跑深度学习：手把手实现 MNIST 手写数字识别 - 曦远Code

程序设计实验室 ·

U-Net 解析：初学者的视觉指南

Yi's blog ·

提升你的机器学习技能：安德鲁·吴课程后的行动指南

提升你的机器学习技能：安德鲁·吴课程后的行动指南

MachineLearningMastery.com ·

加州大学构建基于全连接神经网络的片上光谱仪，在芯片级尺寸上实现8纳米的光谱分辨率

加州大学构建基于全连接神经网络的片上光谱仪，在芯片级尺寸上实现8纳米的光谱分辨率

HyperAI超神经 ·

首先，将原始数据集插值至 640-1000nm 范围内、间隔 1nm 的 361 个波长点，进而与光电二极管的模拟光谱响应进行耦合，生成对应的光电流数据，最后输入训练好的神经网络模型以重建高光谱图像。届时，解读万物的「光指纹」，将不再是实验室的专属，而成为人们认识周遭环境的又一种本能。其革命性在于，将原本重达 15 公斤、长达 70...

＜span class=“js_title_inner“＞加州大学构建基于全连接神经网络的片上光谱仪，在芯片级尺寸上实现8纳米的光谱分辨率＜/span＞

HyperAI超神经 ·

2026年值得关注的图神经网络五大突破

2026年值得关注的图神经网络五大突破

KDnuggets ·

[特殊字符]1篇搞懂AI通识:大白话拆解核心点

[特殊字符]1篇搞懂AI通识:大白话拆解核心点

京东科技开发者 ·