软约束薛定谔桥:一种随机控制方法
原文中文,约300字,阅读约需1分钟。发表于: 。通过允许终端分布与 μ_T 不同,但惩罚两个分布之间的 Kullback-Leibler 散度,我们提出了一种软约束的 Schrödinger bridge(SSB)的最优控制方法,并且从理论上推导了其解决方案,表明最优控制过程的终端分布是 μ_T...
本文介绍了一种软约束的Schrödinger bridge(SSB)的最优控制方法,通过允许终端分布与μ_T不同,但惩罚两个分布之间的Kullback-Leibler散度。该方法的解决方案是最优控制过程的终端分布是μ_T和其他分布的几何混合。该方法在时间序列设置中应用,并提出了鲁棒性生成扩散模型的应用。通过对MNIST数据集的数值实例展示了基于评分匹配的算法从几何混合中进行采样的用途。