本研究提出了一种可控自回归建模框架,解决了视觉生成模型中自回归模型的可控性和灵活性不足的问题。通过将条件控制融入多尺度潜变量建模,显著提高了生成过程的可控性和图像质量,并在减少训练资源的情况下表现出强大的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。