可学习的空间扩张率使得视觉模型更加贴近人类:一项 Grad-CAM 研究
原文中文,约200字,阅读约需1分钟。发表于: 。Dilated Convolution with Learnable Spacing (DCLS) is a convolution method that enhances receptive fields and interpretability, demonstrated by the correlation between GradCAM and ClickMe dataset...
本文提出了一种特别为密集预测设计的新的卷积网络模块,该模块利用扩张卷积系统地汇集多尺度上下文信息,而不会丢失分辨率,并证明了该模块可以提高现有最先进的语义分割系统的精度。作者还探究了将图像分类网络适应于密集预测的可能性,并提出了简化适应后的网络结构有助于提高精度。