神经微分代数方程

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

介绍了连续深度模型,一种使用神经网络参数化隐藏状态导数的新型模型。利用黑箱微分方程求解器计算网络输出,构造连续正则化流模型,并实现端到端训练。

🎯

关键要点

  • 提出了一种新型深度神经网络模型——连续深度模型。
  • 该模型使用神经网络参数化隐藏状态的导数。
  • 利用黑箱微分方程求解器计算网络输出,具有内存成本不变的特点。
  • 模型能够自适应选择评估策略,并显式进行精度与速度的权衡。
  • 研究者证明可以构造连续正则化流模型,通过最大似然进行训练,无需对数据维度进行分区或排序。
  • 展示了如何在较大模型内部向任何ODE求解器进行可扩展的反向传播,实现ODE的端到端训练。
➡️

继续阅读