Louis Aeilot's Blog ·

CS231n 讲义 III：优化

💡 原文英文，约1800词，阅读约需7分钟。

📝

内容提要

优化过程旨在最小化损失函数，常用方法包括随机搜索、梯度下降和随机梯度下降（SGD）。SGD通过小批量数据计算梯度，加速收敛。动量法和RMSProp等技术提高了优化效率，而Adam优化器结合了动量和RMSProp的优点，能够自适应调整学习率。

🎯

关键要点

优化过程旨在最小化损失函数，常用方法包括随机搜索、梯度下降和随机梯度下降（SGD）。
SGD通过小批量数据计算梯度，加速收敛。
动量法和RMSProp等技术提高了优化效率。
Adam优化器结合了动量和RMSProp的优点，能够自适应调整学习率。
随机搜索是一种初步的优化策略，但效率低下。
梯度下降通过计算函数的导数来寻找最优参数。
在大规模应用中，使用小批量梯度下降（Mini-batch Gradient Descent）来提高效率。
SGD可能会受到局部最小值和噪声的影响。
动量法通过加速SGD并减少振荡来提高收敛速度。
RMSProp通过历史平方和的元素级缩放来调整学习率。
Adam优化器结合了动量和RMSProp的优点，适应性强。
学习率是一个超参数，可以随着时间衰减。
二阶优化方法使用梯度和Hessian形成二次近似，但计算量大。
L-BGFS是一种不存储完整逆Hessian的准牛顿方法。

🏷️

继续阅读

CS231n 讲义 II：线性分类器
KNN算法存在缺陷，需要更强大的方法。新方法使用评分函数将图像像素映射为类别分数，并通过损失函数量化预测分数与真实标签的差异。我们采用多类支持向量机（SV...
CS231n 讲义 I：图像分类
图像分类任务是将输入图像分配给固定类别标签，面临视角、尺度、变形、遮挡和光照等挑战。有效模型需对这些变化不敏感，同时对类别间变化敏感。通过积累标记图像的训...
Vercel日志CLI命令现已针对代理进行了优化，支持历史日志查询
Vercel的logs命令经过重建，增强了查询能力，支持按项目和部署ID等过滤历史日志，便于调试和自动监控，默认使用git上下文，简化项目细节指定。
Telnyx与Telarus合作，加速北美地区 AI 驱动型通信的发展
Telnyx与Telarus合作，允许Telarus的代理商和服务提供商利用Telnyx的全球基础设施，提供企业级语音和AI解决方案，推动通信技术和业务创新。
快手也来「凑热闹」，春晚红包到底有什么「魔力」？
快手与央视春晚合作推出红包活动，吸引用户参与。春节期间，腾讯、百度、阿里等巨头加大对AI市场的投入，红包大战升级，重心转向培养AI助手的用户习惯。尽管投入...
研究：成本而非内容才是导致美国流媒体用户流失的主要原因
Parks Associates报告指出，价格是美国消费者取消流媒体服务的主要原因，预计到2025年将达到30%。尽管独家内容重要，但不足以留住用户。低价...

CS231n 讲义 III：优化

内容提要

关键要点

标签

继续阅读