Python 源代码漏洞检测的机器学习技术

应用和比较不同的机器学习算法，我们基于 Python 编程语言针对源代码漏洞检测问题进行实验评估并展示出双向长短期记忆（BiLSTM）模型的非凡性能（平均准确率 = 98.6%，平均 F-Score=94.7%，平均精确率 = 96.2%，平均召回率 = 93.3%，平均 ROC=99.3%），从而为 Python 源代码的漏洞检测树立了新的基准。

本文总结了源代码分析中机器学习的最新研究动态，包括12类软件工程任务、相应的机器学习技术、工具和数据集。文章讨论了每个任务的通用步骤、机器学习技术和可用数据集和工具，并探讨了该领域面临的挑战。