神经微分代数方程
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
介绍了连续深度模型,一种使用神经网络参数化隐藏状态导数的新型模型。利用黑箱微分方程求解器计算网络输出,构造连续正则化流模型,并实现端到端训练。
🎯
关键要点
- 提出了一种新型深度神经网络模型——连续深度模型。
- 该模型使用神经网络参数化隐藏状态的导数。
- 利用黑箱微分方程求解器计算网络输出,具有内存成本不变的特点。
- 模型能够自适应选择评估策略,并显式进行精度与速度的权衡。
- 研究者证明可以构造连续正则化流模型,通过最大似然进行训练,无需对数据维度进行分区或排序。
- 展示了如何在较大模型内部向任何ODE求解器进行可扩展的反向传播,实现ODE的端到端训练。
➡️