形态感知全局注意力用于图像抠图
发表于: 。本研究解决了视觉变换器(ViTs)和卷积神经网络(CNNs)在图像抠图中不能有效保持细微结构细节的问题。提出了一种新颖的形态感知全局注意力机制(MAGA),通过匹配细微结构的局部形态来捕捉形态信息,显著提高了细节保留能力。实验结果表明,基于MAGA的ViT在多个基准测试中显著优于当前最先进的方法,平均在SAD和MSE上分别提高了4.3%和39.5%。
本研究解决了视觉变换器(ViTs)和卷积神经网络(CNNs)在图像抠图中不能有效保持细微结构细节的问题。提出了一种新颖的形态感知全局注意力机制(MAGA),通过匹配细微结构的局部形态来捕捉形态信息,显著提高了细节保留能力。实验结果表明,基于MAGA的ViT在多个基准测试中显著优于当前最先进的方法,平均在SAD和MSE上分别提高了4.3%和39.5%。