小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

现代人工智能训练采用分布式架构,利用多个GPU进行大规模神经网络训练。主要挑战在于高效分配工作负载和同步加速器。应用数据并行性、完全分片数据并行性和混合分片数据并行性等技术,以降低内存使用并提高效率。同时,激活检查点和上下文并行性等方法也用于优化内存和计算性能。

CS231n 讲义:大规模分布式训练

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-19T00:45:09Z

递归神经网络(RNN)用于处理序列数据,具备内部状态(记忆),适应多种输入输出结构。RNN通过递归公式更新隐藏状态并生成输出。长短期记忆(LSTM)通过门控机制解决梯度消失问题,增强信息流动。

CS231n 讲义 VII:递归神经网络

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-07T13:30:09Z

本文讨论了卷积神经网络(CNN)的架构和训练方法,包括归一化层、正则化(如Dropout)、激活函数(如ReLU和GELU)、残差网络(ResNet)和权重初始化(Kaiming初始化)。还介绍了数据预处理、数据增强、迁移学习策略及超参数优化步骤,强调系统调试的重要性,指出大多数失败源于基本设置问题,而非超参数选择。

CS231n 讲义 VI:卷积神经网络架构与训练

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-03T14:45:09Z
CS231n 讲义 V:卷积神经网络基础

卷积神经网络(CNN)通过提取图像特征,解决了传统神经网络在处理大图像时的过拟合和忽视空间结构的问题。CNN由卷积层、池化层和全连接层组成,逐步将原始像素转换为分类分数。卷积层使用可学习的滤波器进行线性操作,池化层通过下采样降低特征图的空间分辨率,同时保持特征的平移不变性。

CS231n 讲义 V:卷积神经网络基础

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-02T14:45:09Z

本文介绍了神经网络的结构,包括输入层、输出层和多个隐藏层,并使用激活函数(如ReLU)引入非线性。反向传播通过计算梯度和链式法则,将误差从输出层向后传播以学习参数。

CS231n 讲义 IV:神经网络与反向传播

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T20:45:09Z

本文介绍了神经网络及其反向传播算法。神经网络由输入层、输出层和多个隐藏层组成,使用激活函数(如ReLU)引入非线性。反向传播通过计算梯度优化网络参数,利用链式法则将误差从输出层传递到隐藏层。

CS231n 讲义 IV:神经网络与反向传播

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-13T20:45:09Z

优化过程旨在最小化损失函数,常用方法包括随机搜索、梯度下降和随机梯度下降(SGD)。SGD通过小批量数据计算梯度,加速收敛。动量法和RMSProp等技术提高了优化效率,而Adam优化器结合了动量和RMSProp的优点,能够自适应调整学习率。

CS231n 讲义 III:优化

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-11T01:45:09Z

本文讨论了优化算法在深度学习中的应用,重点介绍了梯度下降法及其变种,包括随机梯度下降(SGD)和动量法。通过小批量梯度下降提高训练效率,并介绍了RMSProp和Adam优化器的原理与优势,同时提到学习率调整策略和二阶优化方法的局限性。

CS231n 讲义 III:优化

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-11T01:45:09Z
CS231n 讲义 II:线性分类器

KNN算法存在缺陷,需要更强大的方法。新方法使用评分函数将图像像素映射为类别分数,并通过损失函数量化预测分数与真实标签的差异。我们采用多类支持向量机(SVM)损失,结合正则化,优化模型以提高泛化能力。Softmax分类器将分数视为未归一化的对数概率,并使用交叉熵损失进行优化。

CS231n 讲义 II:线性分类器

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-11T00:45:09Z
CS231n 讲义 II:线性分类器

KNN算法存在不足,需要更强的替代方法。新方法引入评分函数和损失函数,评分函数将图像像素映射为类别分数,损失函数则量化预测分数与真实标签的差异。通过正则化优化权重,以提升分类器的泛化能力,防止过拟合。

CS231n 讲义 II:线性分类器

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-11T00:45:09Z
CS231n 讲义 I:图像分类

图像分类任务是将输入图像分配给固定类别标签,面临视角、尺度、变形、遮挡和光照等挑战。有效模型需对这些变化不敏感,同时对类别间变化敏感。通过积累标记图像的训练数据集,开发学习算法进行分类,并通过预测新图像标签评估分类器质量。k近邻分类器通过投票确定标签。

CS231n 讲义 I:图像分类

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-10T00:45:09Z
CS231n 讲义 I:图像分类

图像分类任务是将输入图像分配给固定类别,面临视角、尺度、变形和遮挡等挑战。通过数据驱动的方法,积累标记图像的训练数据集,开发学习算法。使用最近邻分类器评估模型准确性,并通过交叉验证调整超参数。

CS231n 讲义 I:图像分类

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-10T00:45:09Z
CS188 搜索讲义 III

局部搜索算法用于寻找局部最优解,包括爬山算法、模拟退火、局部束搜索和遗传算法。爬山算法通过选择邻近状态优化目标值,但易陷入局部最优。模拟退火结合随机移动和爬山,允许接受较差的移动以避免局部最优。局部束搜索从多个状态开始,选择最佳后续状态。遗传算法通过交叉和变异优化个体,寻找高评分解。

CS188 搜索讲义 III

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-01-27T18:26:09Z
CS188局部搜索讲义 III

本文介绍了局部搜索算法,包括爬山算法、模拟退火、局部束搜索和遗传算法。爬山算法通过选择邻近状态寻找局部最优,但易陷入局部极值。模拟退火结合随机移动和爬山,逐步降低温度以寻求全局最优。局部束搜索从多个状态出发,选择最佳后继续搜索。遗传算法通过交叉和变异优化个体,寻找高评分解。

CS188局部搜索讲义 III

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-01-27T18:26:09Z

本文介绍了UC Berkeley CS188课程第三讲,重点讨论启发式搜索方法,包括贪婪搜索和A*搜索。启发式用于估计到达目标的距离,贪婪搜索选择启发值最低的节点,而A*搜索选择总成本最低的节点。A*搜索在启发式满足可接受性时是最优的。文中还涉及图搜索、启发式的主导性和一致性等概念。

CS188 搜索讲义 II

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-01-26T18:26:09Z
CS188 搜索讲义 I

本文介绍了UC Berkeley CS188课程的讲义,重点讨论人工智能中的理性代理及其类型,如反射代理和规划代理。任务环境通过PEAS框架描述,涵盖性能度量、环境、执行器和传感器。文章还探讨了状态空间、搜索问题及其解决方法,包括无信息搜索、深度优先搜索和广度优先搜索等策略。

CS188 搜索讲义 I

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-01-25T00:45:09Z
CS188 搜索讲义 I

本文介绍了UC Berkeley CS188课程的讲义,重点讨论了人工智能中的理性代理及其类型、任务环境、状态空间和搜索问题。理性代理根据目标选择最佳行动,环境影响代理行为。搜索问题涉及状态空间、可用动作和目标测试,涵盖无信息搜索、深度优先搜索、广度优先搜索及其优缺点,强调统一成本搜索的完整性和最优性。

CS188 搜索讲义 I

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-01-25T00:45:09Z
Agentic AI 讲义

我参加了DeepLearning.AI的Agentic AI课程,学习了核心概念和应用,并获得证书。课程内容较为基础,未深入数学和实现细节。Agentic AI通过多步骤工作流程完成任务,提升了性能和灵活性。任务分解和工具使用是关键,反思设计模式能提高输出质量。Claude Code因其出色的代码生成和评估能力而受到关注。

Agentic AI 讲义

乔克叔叔的床边故事
乔克叔叔的床边故事 · 2025-11-02T12:22:56Z
精选 AWS 资源大全:一站式开发者指南 | 开源日报 No.650

awesome-aws 是一个关于亚马逊网络服务的资源库,提供 SDK、示例代码和项目受欢迎度评估。Meridian 是一个支持广告商管理自定义模型的营销建模框架。Lecture_Notes 项目存储使用 Markdown 格式的讲义,支持数学公式。persian-license-plate-recognition 是一个高精度的波斯车牌识别系统,基于 YOLOv5 实现实时处理。

精选 AWS 资源大全:一站式开发者指南 | 开源日报 No.650

开源服务指南
开源服务指南 · 2025-06-29T07:35:44Z
回炉重铸, 91 天见证不一样的自己(第 15 期)

第15期《91天学算法》将于2024年12月1日启动,旨在提升学习者的算法能力。活动包括每日题目、讲义更新和实用技巧,参与者需遵守打卡规则。报名方式有微信群、官网和GitHub,购书可免费参与。活动结束后将提供电子书回顾讲义和题解。

回炉重铸, 91 天见证不一样的自己(第 15 期)

lucifer的网络博客
lucifer的网络博客 · 2024-11-22T16:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码