Efficient-VQGAN: 高分辨率图像生成的高效视觉 Transformer
原文中文,约300字,阅读约需1分钟。发表于: 。通过引入局部关注机制、融合全局关注和局部关注机制、以及自动编码训练和自回归生成策略,提出了一种高分辨率图像生成的高效两阶段框架,实现了更高效率、更好的重建质量和更高分辨率的图像合成。
该研究使用Transformer模型架构,将自我关注机制限制在局部邻域,提高了模型处理大图像的能力,并在图像生成方面表现优异。此外,该研究还进行了图像超分辨率实验,发现其生成的图像比之前的最优模型更能欺骗人类观察者。