小红花·文摘

本文介绍了一种新的离散扩散概率模型DARL，基于Transformer架构进行图像生成，提升了全局一致性和多样性。研究表明，去噪补丁解码器和特定噪声时间表能改善生成效果。此外，AutoNAT方法显著提升了非自回归变压器的性能。DnD-Transformer模型解决了信息损失问题，展示了在图像生成中的潜力。DART模型结合自回归与扩散模型，提高了图像合成效率。

HART：高效的混合自回归变换器视觉生成模型

BriefGPT - AI 论文速递 ·

本文介绍了一种新的离散扩散概率模型，利用无约束的Transformer架构实现向量量化标记的并行预测，从而提升图像生成的质量和多样性。研究中提出了Token-Critic辅助模型和正则化的向量量化框架，显著改善了生成效果。此外，SEED和MAGVIT-v2等新技术展示了大型语言模型在图像和视频生成中的优势，并提出了TiTok和Open-MAGVIT2等新方法，优化了图像生成过程，推动了该领域的创新。

图像文件夹：折叠标记的自回归图像生成

BriefGPT - AI 论文速递 ·

本文介绍了非自回归模型在图像生成中的优势，包括高效生成和低推理延迟。提出了一种新的离散扩散概率模型，利用无约束的Transformer架构实现并行预测，提升图像生成的多样性和一致性。同时，研究了基于矢量量化的文本到图像生成方法，显著改善了复杂场景图像的生成质量。

无向量量化的自回归图像生成

BriefGPT - AI 论文速递 ·