基于大型语言模型的自动修复bug的代理的实证研究
发表于: 。本研究解决了现有研究中对大型语言模型(LLM)及其代理在自动修复软件缺陷时表现的系统分析不足的问题。通过对七个代理和非代理系统在SWE-bench Lite基准上的性能评估,我们发现了一些系统能够唯一解决特定问题,而其他系统则无法解决。这一发现表明,在LLM及其代理设计上仍需进一步优化,以提升自动修复bug的有效性。
本研究解决了现有研究中对大型语言模型(LLM)及其代理在自动修复软件缺陷时表现的系统分析不足的问题。通过对七个代理和非代理系统在SWE-bench Lite基准上的性能评估,我们发现了一些系统能够唯一解决特定问题,而其他系统则无法解决。这一发现表明,在LLM及其代理设计上仍需进一步优化,以提升自动修复bug的有效性。