Louis Aeilot's Blog ·

CS231n 讲义 III：优化

💡 原文英文，约1800词，阅读约需7分钟。

📝

内容提要

优化过程旨在最小化损失函数，常用方法包括随机搜索、梯度下降和随机梯度下降（SGD）。SGD通过小批量数据计算梯度，加速收敛。动量法和RMSProp等技术提高了优化效率，而Adam优化器结合了动量和RMSProp的优点，能够自适应调整学习率。

🎯

❓

优化过程的主要目标是最小化损失函数。

SGD通过计算小批量数据的梯度来进行参数更新，从而加速收敛。

动量法通过加速SGD并减少振荡来提高收敛速度。

RMSProp通过历史平方和的元素级缩放来调整学习率，旨在提高训练速度和性能。

Adam优化器结合了动量和RMSProp的优点，能够自适应调整学习率，适应性强。

学习率是一个超参数，控制参数更新的步长，影响收敛速度和稳定性。

🏷️

腾讯开源 Hy-MT1.5 翻译模型：440MB 跑出顶级翻译能力；从图像序列到点云生成：LingBot-Map 在线 3D 重建流程
腾讯推出的Hy-MT1.5-1.8B-1.25bit是一款轻量级多语言翻译模型，支持33种语言和1056个翻译方向，翻译效果优于部分大型模型，参数仅为18亿。
《Mixtape》是一幅关于青少年生活的音乐肖像
Playing Mixtape is like playing a video game version of a high school movie. ...
清理电脑所需的应用程序
Hi, friends! Welcome to Installer No. 128, your guide to the best and Verge-i...
我推荐的适合几乎所有人的笔记本电脑
Need a new laptop? It’s a tough decision. If you’re like most people, a lapto...
GitHub推出新Copilot应用，瞄准Claude Code和Codex
GitHub推出了独立的Copilot桌面应用，旨在集中管理编码任务、问题和拉取请求。该应用支持多种操作系统，允许开发者直接从GitHub启动任务并跟踪进...
前沿部署工程师是AI领域最热门的职位，OpenAI和谷歌正在争相招聘。以下是成为前沿部署工程师的方法。
前沿部署工程师（FDE）成为AI领域热门职位，负责将AI模型与企业实际应用连接。OpenAI和谷歌等公司正在大规模招聘FDE，以应对企业AI实施中的挑战。...