ConDefects: 解决基于 LLM 的故障定位和程序修复中的数据泄漏问题的新数据集
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了一种基于人类编程阶段的生成和编辑方法,以提高大型语言模型在竞争性编程任务方面的代码质量。研究评估了9种常见代码生成LLM在两个竞争性编程数据集上的表现,结果表明该方法在APP-dev、APPS-test和HumanEval上的表现均优于其他后处理方法。
🎯
关键要点
-
提出了一种基于人类编程阶段的生成和编辑方法。
-
该方法旨在提高大型语言模型在竞争性编程任务中的代码质量。
-
研究评估了9种常见代码生成LLM在两个竞争性编程数据集上的表现。
-
在APP-dev上,该方法的pass@1平均值提高了89%。
-
在APPS-test上,该方法的pass@1平均值提高了31%。
-
在HumanEval上,该方法的pass@1平均值提高了48%。
-
该方法的表现优于其他后处理方法。
➡️