本研究提出了一种名为SlotDiffusion的对象中心潜在扩散模型,旨在提升物体图像生成质量。该模型在多个数据集上表现优异,并展示了与自监督预训练图像编码器的可扩展性。研究还引入了槽注意机制和自适应槽注意机制,增强了物体表示的灵活性和可解释性,推动了无监督图像分割和重构的进展。
完成下面两步后,将自动完成登录并继续当前操作。