小红花·文摘

华为云官方博客 ·

本研究探讨大型语言模型在代码生成中的漏洞与许可风险，强调高质量合规数据集的重要性。提出了一种自动化代码自审核技术，利用开源项目历史提升数据质量，发现17%的代码版本为更新，表明改进数据策划可增强AI工具输出的可靠性。

BriefGPT - AI 论文速递 ·