该研究提出了一种基于人类编程阶段的生成和编辑方法,以提高大型语言模型在竞争性编程任务方面的代码质量。研究评估了9种常见代码生成LLM在两个竞争性编程数据集上的表现,结果显示该方法在APP-dev、APPS-test和HumanEval上的表现均优于其他后处理方法。
完成下面两步后,将自动完成登录并继续当前操作。