💡
原文中文,约2800字,阅读约需7分钟。
📝
内容提要
伊利诺伊大学香槟分校的研究团队提出了一种无Agent的自动修复软件工程问题的方法,名为OpenAutoCoder-Agentless。该方法在GitHub上获得了很高的关注度,并在解决问题的成本和性能方面超过了现有的开源Agent解决方案。研究者还发现了SWE-bench Lite数据集中问题描述的质量问题,并提出了一个过滤后的严格问题子集SWE-bench Lite-S。作者呼吁技术和研究社区停下来思考Agent的关键设计和评估方法。
🎯
关键要点
- 伊利诺伊大学香槟分校提出了一种无Agent的自动修复软件工程问题的方法,名为OpenAutoCoder-Agentless。
- OpenAutoCoder-Agentless在解决问题的成本和性能方面超过了现有的开源Agent解决方案。
- 研究者发现SWE-bench Lite数据集中存在问题描述的质量问题,并提出了过滤后的严格问题子集SWE-bench Lite-S。
- Agentless框架以显著更低的成本解决GitHub问题,解决率达到27.33%。
- Agentless使用分层查询方法定位和修复代码中的bug,具有改进的潜力。
- 对SWE-bench Lite数据集的分析显示,部分问题描述中包含了完整的答案或误导性解决方案。
- 研究者提出SWE-bench Lite-S,以去除不合理的问题并标准化基准测试的难度水平。
- 作者呼吁技术和研究社区重新思考Agent的设计与评估方法。
➡️