合成代码修复:利用大型语言模型和合成数据修复错误和漏洞
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种利用大型语言模型生成合成数据的方法,以解决自动程序修复中高质量训练数据稀缺的问题。生成了约30,000个错误代码与修复代码的配对示例,显著提高了预测准确率,推动了自动代码维护工具的发展。
🎯
关键要点
- 本研究提出了一种利用大型语言模型生成合成数据的方法。
- 该方法旨在解决自动程序修复中高质量训练数据稀缺的问题。
- 生成了约30,000个错误代码与修复代码的配对示例。
- 经过严格的质量评估,显示出在完美预测率上具有显著改善。
- 该方法可能转变软件工程任务中对数据稀缺的应对方式。
- 推动了自动代码维护工具的发展。
➡️