贝尔曼扩散:生成建模作为在分布空间中学习线性算子

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

我们提出了一种最大熵反向强化学习方法,称为最大熵 IRL 的扩散 (DxMI),用于在较少生成步骤下提高扩散生成模型的样本质量。通过同时训练扩散模型和基于能量的模型,实现了高效更新和收敛。我们还引入了动态规划扩散 (DxDP) 算法,优化了模型更新。实验证明,DxMI 能在少量步骤内生成高质量样本,并提升异常检测性能。

原文中文,约500字,阅读约需2分钟。
阅读原文