本文介绍了一种新的离散扩散概率模型DARL,基于Transformer架构进行图像生成,提升了全局一致性和多样性。研究表明,去噪补丁解码器和特定噪声时间表能改善生成效果。此外,AutoNAT方法显著提升了非自回归变压器的性能。DnD-Transformer模型解决了信息损失问题,展示了在图像生成中的潜力。DART模型结合自回归与扩散模型,提高了图像合成效率。
本文介绍了一种新的离散扩散概率模型,利用无约束的Transformer架构实现向量量化标记的并行预测,从而提升图像生成的质量和多样性。研究中提出了Token-Critic辅助模型和正则化的向量量化框架,显著改善了生成效果。此外,SEED和MAGVIT-v2等新技术展示了大型语言模型在图像和视频生成中的优势,并提出了TiTok和Open-MAGVIT2等新方法,优化了图像生成过程,推动了该领域的创新。
本文介绍了非自回归模型在图像生成中的优势,包括高效生成和低推理延迟。提出了一种新的离散扩散概率模型,利用无约束的Transformer架构实现并行预测,提升图像生成的多样性和一致性。同时,研究了基于矢量量化的文本到图像生成方法,显著改善了复杂场景图像的生成质量。
完成下面两步后,将自动完成登录并继续当前操作。