本研究探讨了一致性模型训练的局限性,提出通过马尔可夫决策过程进行去噪,并利用时间差分学习进行价值估计。新方法在CIFAR-10和ImageNet-64上显著提升了性能,尤其在ImageNet-64上达到了最新的最佳效果。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: