小红花·文摘 - 小红花技术领袖俱乐部

本研究从模式连通性视角探讨机器遗忘中的损失景观与优化动态，分析不同遗忘方法及其相互关系，揭示评估指标波动模式及遗忘方法的相似性与差异，为理解机器遗忘提供新思路。

通过模式连通性理解机器遗忘

BriefGPT - AI 论文速递 ·

解锁河谷损失景观：为何热身-稳定-衰减学习率表现优异

解锁河谷损失景观：为何热身-稳定-衰减学习率表现优异

DEV Community ·

本研究提出“中心流”思想，利用差分方程分析深度学习优化轨迹的时间平均行为，揭示自适应优化器如何调节步长以更有效地应对损失景观。

Understanding Optimization and Central Flow in Deep Learning

BriefGPT - AI 论文速递 ·

该论文研究了多尺度数据对机器学习算法的影响，特别是在深度学习中。它揭示了损失景观中的多尺度结构，并提出了一种新的梯度下降方法以提高训练效率。

数据引导的多尺度损失和高效多速率梯度下降方案

BriefGPT - AI 论文速递 ·