本研究探讨了语义保持转换在缺陷检测中的有效性。尽管有93种可重用的转换,最终选用的转换未能提高模型的准确性,显示出实际应用中的挑战和可能导致的语义错误。
研究发现语义保持转换的自然性对NPR系统评估有影响,60%的转换被认为是自然的,20%的转换被认为是不自然的。不自然的转换对NPR系统的稳健性测试造成了25.2%的误报率,自然转换下NPR系统性能显著下降。研究提出了基于交叉熵的新自然度度量标准,并成功实现了代码转换的自然度自动评估。
完成下面两步后,将自动完成登录并继续当前操作。