从离散时间策略到连续时间扩散采样器:渐近等价与更快的训练
📝
内容提要
本研究解决了在没有目标样本的情况下训练神经随机微分方程(扩散模型)以从玻尔兹曼分布中采样的问题,填补了现有方法的不足。通过证明在无穷小离散化步长极限下多种目标的等价关系,将熵强化学习方法与连续时间对象关联,进一步表明适当的粗时间离散化选择能显著提高样本效率,降低计算成本并在标准采样基准上实现竞争性表现。
➡️
本研究解决了在没有目标样本的情况下训练神经随机微分方程(扩散模型)以从玻尔兹曼分布中采样的问题,填补了现有方法的不足。通过证明在无穷小离散化步长极限下多种目标的等价关系,将熵强化学习方法与连续时间对象关联,进一步表明适当的粗时间离散化选择能显著提高样本效率,降低计算成本并在标准采样基准上实现竞争性表现。