近年来,基于深度学习模型的漏洞检测器取得了显著效果,但其决策过程不透明且难以理解。研究者提出了各种解释方法,但对关键特征的深入评估仍然缺乏。本研究通过两个指标评估了十种解释方法的性能,发现准确度无法充分评估这些方法。同时,所有方法在与漏洞相关的代码行的准确度上表现较差,可能是因为解释器选择重要特征和深度学习检测器学习到的不相关的工件方面的低效性。
近年来,基于深度学习模型的漏洞检测器取得了显著效果,但决策过程不透明且难以理解。研究者提出了各种解释方法,但对关键特征的评估仍然不足。本研究通过定量指标评估了十种漏洞检测器解释方法的性能,发现准确度无法充分评估这些方法。同时,发现所有方法在与漏洞相关的代码行的准确度上表现较差,归因于解释器选择重要特征和深度学习检测器学习到的不相关的工件方面的低效性。
完成下面两步后,将自动完成登录并继续当前操作。