本研究探讨了网络入侵检测系统中黑盒人工智能模型的可解释性,提出使用白盒可解释技术,并评估LRP、IG和DeepLift在多个数据集上的表现,结果表明白盒技术在鲁棒性和完整性方面优于黑盒技术。
通过结合GradCAM和LRP方法,研究人员提出了一种新的技术来解释基于CNN的模型的输出。他们通过对GradCAM方法产生的解释进行处理,去除噪声,并将处理后的输出与LRP的输出相乘,最后应用高斯模糊。通过比较Faithfulness、Robustness、Complexity、Localisation和Randomisation等指标,发现该方法在Complexity方面表现更好,并且在其他指标中至少比其中一种方法表现更好。
该研究介绍了一种名为层次反馈传播 (LFP) 的新型训练方法,利用层次相关传播 (LRP) 为神经网络预测器中的个别连接分配奖励。LFP 在模型中传播奖励信号,增强了接收到积极反馈的结构,减少了接收到负反馈的结构的影响。研究还探讨了将不同的LRP规则扩展到LFP中的方法,以及潜在的应用,例如训练没有有意义的导数的模型或用于转移学习。
完成下面两步后,将自动完成登录并继续当前操作。