软约束薛定谔桥:一种随机控制方法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种软约束的Schrödinger bridge(SSB)的最优控制方法,通过允许终端分布与μ_T不同,但惩罚两个分布之间的Kullback-Leibler散度。该方法的解决方案是最优控制过程的终端分布是μ_T和其他分布的几何混合。该方法在时间序列设置中应用,并提出了鲁棒性生成扩散模型的应用。通过对MNIST数据集的数值实例展示了基于评分匹配的算法从几何混合中进行采样的用途。
🎯
关键要点
-
提出了一种软约束的Schrödinger bridge(SSB)的最优控制方法。
-
允许终端分布与μ_T不同,但惩罚两个分布之间的Kullback-Leibler散度。
-
最优控制过程的终端分布是μ_T和其他分布的几何混合。
-
该方法在时间序列设置中应用。
-
提出了鲁棒性生成扩散模型的应用。
-
基于评分匹配的算法用于从几何混合中进行采样。
-
通过对MNIST数据集的数值实例展示了算法的用途。
➡️