风格链接:理解深度学习模型中的学习特征
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对卷积神经网络(CNN)学习到的难以解读的特征进行分析,提出了一种自动化可视化方法,通过引入链接网络实现预训练分类器倒数第二层与生成模型潜在空间(StyleGAN-XL)之间的映射。研究发现,这两者之间存在一致的语义顺序,能够以较低的计算成本系统性地分析学习到的表示,进而量化分类器的决策边界。
本研究提出了一种网络切片框架,通过评估隐藏单元与语义概念的对齐来量化CNN的可解释性。分析卷积层单元的语义,测试其可解释性,并比较不同训练任务的网络表示。研究了训练迭代、网络初始化、深度和宽度对可解释性的影响,以及dropout和批标准化的效果。结果显示该方法能揭示CNN模型和训练方法之外的特征。