Louis Aeilot's Blog ·

CS231n 讲义 III：优化

💡 原文英文，约1400词，阅读约需5分钟。

📝

内容提要

本文讨论了优化算法在深度学习中的应用，重点介绍了梯度下降法及其变种，包括随机梯度下降（SGD）和动量法。通过小批量梯度下降提高训练效率，并介绍了RMSProp和Adam优化器的原理与优势，同时提到学习率调整策略和二阶优化方法的局限性。

🎯

❓

梯度下降法是一种通过计算损失函数的梯度来更新参数的优化方法。

随机梯度下降通过对小批量数据计算梯度，提高了训练效率，能够更快地收敛。

动量法通过加速梯度下降并减小振荡，帮助更快地收敛到最优解。

RMSProp通过对历史平方和进行元素级缩放，动态调整学习率，从而提高训练性能。

Adam优化器结合了动量法和RMSProp的优点，能够动态调整学习率，适应性更强。

学习率调整策略包括时间衰减、固定点减小等方法，用于优化训练过程。

🏷️

DeepSeek-V4 技术解析：架构革新与 Coding Agent 后训练优化
DeepSeek-V4技术通过架构创新和后训练优化，显著提升了长上下文处理能力。其混合注意力机制和流形约束超连接提高了效率与稳定性。后训练阶段采用专家培养...
16个Google AdSense CPC优化技巧，快速提升广告点击收益
许多国内站长在使用Google AdSense时面临低CPC的问题，尽管流量可观。文章总结了15个提升CPC的技巧，包括选择高价值内容领域、优化广告布局、...
Christophe Pettus: Managed Postgres, Examined: Amazon RDS for PostgreSQL
First in a series of dispassionate surveys of the major managed-Postgres offe...
How Slack Manages Context in Long-Running Multi-agent Systems
To sustain productivity in long-running agent systems, Slack engineers moved ...
埃隆·马斯克告诉陪审团，他所想做的就是拯救人类
在与OpenAI联合创始人萨姆·阿尔特曼的法庭对峙中，埃隆·马斯克试图塑造自己为拯救人类的英雄，强调创办SpaceX和特斯拉的初衷是为了人类未来，并表达对...
泰勒·斯威夫特正在加大对AI模仿者的法律斗争
泰勒·斯威夫特正在申请商标以保护自己免受AI模仿者的侵害。她的团队申请了两个短语的商标，并提交了相关音频片段。尽管法律对AI生成音乐的保护有限，但商标可能...