基于距离加权的 Transformer 网络用于图像补全
原文约400字/词,阅读约需1分钟。发表于: 。本文提出了一种新的架构,利用基于距离加权变换器的方法 (DWT) 来更好地理解图像组成部分之间的关系,并结合卷积神经网络 (CNNs) 和 DWT 块的优势来增强图像完成过程,通过编码全局依赖并计算基于距离加权的特征图,有效减少了视觉的歧义问题。同时,引入了残差快速傅里叶卷积 (Res-FFC)...
本文提出了一种新的图像生成架构,利用基于距离加权变换器的方法和卷积神经网络来增强图像完成过程,有效减少了视觉歧义问题。同时,引入了残差快速傅里叶卷积块来进一步改进对重复纹理的生成,并提出了一种归一化卷积的非零值的技术和高效的训练稳定器。通过在三个数据集上进行实验,证明了该模型相比现有方法的优越性。