RandAR:仅解码器的随机顺序自回归视觉生成

📝

内容提要

本研究解决了现有自回归视觉生成模型在生成顺序上的限制。通过引入“位置指令标记”,RandAR允许以随机顺序生成图像,并且在训练过程中以随机排列的标记序列进行,从而表现出与传统顺序生成的模型相媲美的性能。RandAR在推理时实现并行解码,提升生成效率,并在不牺牲质量的前提下实现了2.5倍的加速,展现了在多种应用场景中的潜力。

🏷️

标签

➡️

继续阅读