💡
原文中文,约1600字,阅读约需4分钟。
📝
内容提要
本文探讨了通过自然语言摘要实现微服务多仓库的Bug定位,提出了分层摘要和两阶段搜索的方法,成功在企业项目中超越了GitHub Copilot和Cursor,解决了语义鸿沟问题。
🎯
关键要点
- 本文探讨了通过自然语言摘要实现微服务多仓库的Bug定位。
- 提出了分层摘要和两阶段搜索的方法。
- 成功在企业项目中超越了GitHub Copilot和Cursor。
- 解决了语义鸿沟问题。
- 微服务架构调试困难,代码分散在多个仓库,Bug报告为自然语言。
- 研究团队将问题重新定义为自然语言推理任务。
- 分层摘要在文件、目录、仓库三个层级构建上下文感知的摘要。
- 两阶段搜索方法:第一阶段路由Bug报告到相关仓库,第二阶段在仓库内定位。
- 在DNEXT Technology的企业级项目上验证了46个仓库和110万行代码。
- 分层摘要避免了直接将代码输入LLM,先转换为自然语言摘要。
- 两阶段搜索方法提高了定位的速度和准确性。
- 研究创新在于重新定义问题,采用NL-to-NL搜索。
- 开发者建议:系统化方法定位Bug,使用自然语言摘要,分层思考。
- 企业级验证增强了研究的说服力,ICSE 2026值得关注。
➡️