本文提出了一种自动发现黑盒生成模型安全漏洞的方法,研究了代码生成模型的安全性,发现其易受攻击。通过分析现有防御方法的局限性,提出了增强代码安全性的策略,并开发了漏洞分析系统SecRepair,帮助开发者识别和修复代码漏洞。研究强调了改进大型语言模型训练和使用方法的重要性,以实现更安全的模型部署。
本研究使用大型语言模型评估了九种代码生成模型,发现其中代码函数存在偏差的比例在31.45%到79.93%之间,受到偏差影响的代码函数比例在9.68%到37.37%之间。为减轻偏差,提出了三种缓解策略,成功将偏差代码比例降低到0.4%到4.57%。
本文介绍了新的基准测试,测试多语言环境下的代码生成模型性能,发现多语言模型优势,通过 few-shot prompting 实现了模型新语言教学和 zero-shot translation 能力,利用其代码生成模型在多种语言上实现了大规模引导过程,产生了其他评估任务中使用的合成规范解决方案。
本研究评估了9种代码生成模型的偏差情况,发现31.45%到79.93%的代码函数存在偏差,其中9.68%到37.37%的代码函数存在软件行为风险。提出了三种缓解策略,可以将偏差代码比例降低到0.4%到4.57%。
本文介绍了新的基准测试,测试多语言环境下代码生成模型的性能,并发现多语言模型的优势。作者通过 few-shot prompting 实现了对模型新语言的教学能力和在单语言环境下的 zero-shot translation 能力。同时,作者利用其代码生成模型在多种语言上实现了大规模引导过程,产生了其他评估任务中使用的合成规范解决方案。
完成下面两步后,将自动完成登录并继续当前操作。