代码优化:自动生成的正确性和效率偏好数据

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于人类编程阶段的生成和编辑方法,用于提高大型语言模型在竞争性编程任务中的代码质量。通过对9种常见代码生成语言模型进行评估,结果显示该方法在不同数据集上的表现优于其他后处理方法。

🎯

关键要点

  • 提出了一种基于人类编程阶段的生成和编辑方法。
  • 该方法旨在提高大型语言模型在竞争性编程任务中的代码质量。
  • 对9种常见代码生成语言模型进行了评估。
  • 在APP-dev数据集上,pass@1平均值提高了89%。
  • 在APPS-test数据集上,pass@1平均值提高了31%。
  • 在HumanEval数据集上,pass@1平均值提高了48%。
  • 该方法的表现优于其他后处理方法。
🏷️

标签

➡️

继续阅读