小红花·文摘

本文提出了一种自动发现黑盒生成模型安全漏洞的方法，研究了代码生成模型的安全性，发现其易受攻击。通过分析现有防御方法的局限性，提出了增强代码安全性的策略，并开发了漏洞分析系统SecRepair，帮助开发者识别和修复代码漏洞。研究强调了改进大型语言模型训练和使用方法的重要性，以实现更安全的模型部署。

针对黑盒代码补全引擎的实际攻击

BriefGPT - AI 论文速递 ·

本研究使用大型语言模型评估了九种代码生成模型，发现其中代码函数存在偏差的比例在31.45%到79.93%之间，受到偏差影响的代码函数比例在9.68%到37.37%之间。为减轻偏差，提出了三种缓解策略，成功将偏差代码比例降低到0.4%到4.57%。

挑战前人未达之地：暴露代码生成评估中的偏见和不足

BriefGPT - AI 论文速递 ·

本文介绍了新的基准测试，测试多语言环境下的代码生成模型性能，发现多语言模型优势，通过 few-shot prompting 实现了模型新语言教学和 zero-shot translation 能力，利用其代码生成模型在多种语言上实现了大规模引导过程，产生了其他评估任务中使用的合成规范解决方案。

语言无关代码嵌入

BriefGPT - AI 论文速递 ·

本研究评估了9种代码生成模型的偏差情况，发现31.45%到79.93%的代码函数存在偏差，其中9.68%到37.37%的代码函数存在软件行为风险。提出了三种缓解策略，可以将偏差代码比例降低到0.4%到4.57%。

Kelly 是一个温暖的人，Joseph 是一个榜样》：LLM 生成的推荐信中的性别偏见

BriefGPT - AI 论文速递 ·

本文介绍了新的基准测试，测试多语言环境下代码生成模型的性能，并发现多语言模型的优势。作者通过 few-shot prompting 实现了对模型新语言的教学能力和在单语言环境下的 zero-shot translation 能力。同时，作者利用其代码生成模型在多种语言上实现了大规模引导过程，产生了其他评估任务中使用的合成规范解决方案。

CodeFuse-13B：一个预训练的多语言编码大型语言模型

BriefGPT - AI 论文速递 ·