本研究探讨了神经网络学习中的距离表示选择。通过对六种MNIST网络架构的实验,提出了新的几何框架和OffsetL2架构,验证了距离学习对神经网络设计的重要性,结果表明表示方式直接影响模型性能。
本文研究扩散模型中的记忆化问题,提出几何框架,通过分析对数概率密度的Hessian特征值,发现记忆化源于孤立点,并通过实验验证了该方法的有效性。
完成下面两步后,将自动完成登录并继续当前操作。