生成扩散模型漫谈(三十一):预测数据而非噪声

科学空间|Scientific Spaces 科学空间|Scientific Spaces ·

LDM(潜在扩散模型)仍然是主流,但高倍压缩导致信息损失。新方法JiT直接预测原始数据,简化模型架构,提升高分辨率生成效果。尽管JiT未显著超越现有SOTA,但降低了计算成本,增强了模型的可迁移性和统一性。

原文中文,约5400字,阅读约需13分钟。
阅读原文