ConDefects: 解决基于 LLM 的故障定位和程序修复中的数据泄漏问题的新数据集

原文约300字,阅读约需1分钟。发表于:

通过引入名为 ConDefects 的数据集,我们为故障定位和程序修复这两个任务的研究提供了一个全新的数据集,该数据集消除了已有广泛采用的基准测试中的重叠,并提供了包括 Java 和 Python 故障程序以及其修复版本在内的 1,254 个故障程序和 1,625 个故障程序。

该研究提出了一种基于人类编程阶段的生成和编辑方法,以提高大型语言模型在竞争性编程任务方面的代码质量。研究评估了9种常见代码生成LLM在两个竞争性编程数据集上的表现,结果表明该方法在APP-dev、APPS-test和HumanEval上的表现均优于其他后处理方法。

相关推荐 去reddit讨论