小红花·文摘

该研究提出了一种基于人类编程阶段的生成和编辑方法，以提高大型语言模型在竞争性编程任务方面的代码质量。研究评估了9种常见代码生成LLM在两个竞争性编程数据集上的表现，结果显示该方法在APP-dev、APPS-test和HumanEval上的表现均优于其他后处理方法。