我们提出了一种最大熵反向强化学习方法,称为最大熵 IRL 的扩散 (DxMI),用于在较少生成步骤下提高扩散生成模型的样本质量。通过同时训练扩散模型和基于能量的模型,实现了高效更新和收敛。我们还引入了动态规划扩散 (DxDP) 算法,优化了模型更新。实验证明,DxMI 能在少量步骤内生成高质量样本,并提升异常检测性能。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: