深度学习漏洞检测在真实数据集上的性能再探讨
原文中文,约400字,阅读约需1分钟。发表于: 。该研究探讨了软件漏洞对日常软件系统的重大影响,评估了深度学习模型在现实场景中的表现,并发现了性能下降和过拟合等问题,提出了一个改进的数据集用于评估模型,并提出了增强技术以提高性能。
近年来,基于深度学习模型的漏洞检测器取得了显著效果,但决策过程不透明且难以理解。研究者提出了各种解释方法,但对关键特征的评估仍然不足。本研究通过定量指标评估了十种漏洞检测器解释方法的性能,发现准确度无法充分评估这些方法。同时,发现所有方法在与漏洞相关的代码行的准确度上表现较差,归因于解释器选择重要特征和深度学习检测器学习到的不相关的工件方面的低效性。