科学空间|Scientific Spaces ·

流形上的最速下降：1. SGD + 超球面

💡 原文中文，约8300字，阅读约需20分钟。

📝

内容提要

本文探讨了约束优化中“最速下降方向”与梯度的关系，强调不同范数对最速下降方向的影响。通过分析SGD在超球面上的应用，提出了“最小作用量原理”，并讨论了在约束条件下的参数更新优化方法。

🎯

❓

最速下降方向通常是梯度的反方向，但在约束优化中，这一关系可能会改变，具体取决于所选的范数。

不同的范数定义会导致最速下降方向的不同，选择不同的范数会影响优化器的性能和收敛速度。

最小作用量原理用于评估优化器的性能，旨在在保证稳定性的前提下加快模型的收敛速度。

在超球面上的SGD优化要求更新后的参数仍需保持在单位球面上，这增加了约束条件的复杂性。

通过一阶近似，可以将非线性约束转化为线性约束，从而简化求解过程。

在不同范数下，最速下降方向的求解方法会有所不同，尤其在p范数的情况下，求解过程可能变得复杂。

🏷️

Replit shows how vibe coding is getting its own financial stack — and a path to profit
Making apps is easier than it’s ever been, but making money from them is anot...
Cloudflare aqui-hires VoidZero: Did a piece of the open web just stabilize, or become more brittle?
Cloud network security and content delivery network company Cloudflare announ...
60分钟内消失
CBS的《60分钟》节目面临危机，著名记者斯科特·佩利因质疑管理层而被解雇。节目记者对此决定表示不安，认为新闻室不应像独裁政权运作。佩利指责新管理层在政治...
20260605的胡言乱语
本文介绍了多种技术工具和方法，包括YAMLResume简历管理工具、终端中的cal命令、Shlink短链接服务、systemd timers替代cron、...
随想 - 20260605
本文介绍了多个技术主题，包括YAML简历管理工具、快速日历命令、MacBook加热技巧、自托管URL缩短器Shlink、将智能手机转为功能手机的体验、sy...
Sonos Era 100音箱降至数月以来最低价格
Sonos Era 100智能音箱现价189美元，降价30美元，翻新款134美元。该音箱音质优良，支持蓝牙和USB-C，适合多房间播放。Google Ne...