小红花·文摘

本文研究扩散模型中的记忆化问题，提出几何框架，通过分析对数概率密度的Hessian特征值，发现记忆化源于孤立点，并通过实验验证了该方法的有效性。

通过概率景观中的尖锐性理解生成模型中的记忆化

BriefGPT - AI 论文速递 ·

本文探讨了深度神经网络（DNN）在特定情况下的优越性，分析了使用ReLU激活的DNN的泛化误差和收敛速率。研究表明，DNN在图像分类等任务中表现出色，并提出了一种新算法来训练ReLU DNN，提升了函数逼近的效果。此外，文章讨论了深度学习的几何框架及其与物理学的结合，为未来神经网络结构提供了理论指导。

深度学习作为 Ricci 流

BriefGPT - AI 论文速递 ·