本研究提出“中心流”思想,利用差分方程分析深度学习优化轨迹的时间平均行为,揭示自适应优化器如何调节步长以更有效地应对损失景观。
研究了差分方程发现的差异化方法在数据驱动中的关键作用,并提出了替代常用有限差分方法的方法,评估了其在真实问题上的适用性和收敛能力。
完成下面两步后,将自动完成登录并继续当前操作。