本文介绍了一种软约束的Schrödinger bridge(SSB)的最优控制方法,通过允许终端分布与μ_T不同,但惩罚两个分布之间的Kullback-Leibler散度。该方法的解决方案是最优控制过程的终端分布是μ_T和其他分布的几何混合。该方法在时间序列设置中应用,并提出了鲁棒性生成扩散模型的应用。通过对MNIST数据集的数值实例展示了基于评分匹配的算法从几何混合中进行采样的用途。
完成下面两步后,将自动完成登录并继续当前操作。