MdEval:大规模多语言代码调试
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了首个大规模多语言调试基准MdEval,涵盖18种编程语言的3.6K测试样本,显著提升了多语言代码调试效果,并揭示了开源与闭源模型之间的性能差距。
🎯
关键要点
- 本研究提出了首个大规模多语言调试基准MdEval。
- MdEval涵盖18种编程语言的3.6K测试样本。
- 研究解决了现有代码调试基准主要集中在Python语言的问题。
- 引入了调试指令语料库MDEVAL-INSTRUCT。
- 开发了多语言调试器xDebugCoder。
- 显著提高了多语言代码调试的效果。
- 揭示了开源模型与闭源大型语言模型之间的性能差距。
- 显示出该领域的巨大改进空间。
➡️