Microservice Bug Localization

Microservice Bug Localization

💡 原文中文,约1600字,阅读约需4分钟。
📝

内容提要

本文探讨了通过自然语言摘要实现微服务多仓库的Bug定位,提出了分层摘要和两阶段搜索的方法,成功在企业项目中超越了GitHub Copilot和Cursor,解决了语义鸿沟问题。

🎯

关键要点

  • 本文探讨了通过自然语言摘要实现微服务多仓库的Bug定位。
  • 提出了分层摘要和两阶段搜索的方法。
  • 成功在企业项目中超越了GitHub Copilot和Cursor。
  • 解决了语义鸿沟问题。
  • 微服务架构调试困难,代码分散在多个仓库,Bug报告为自然语言。
  • 研究团队将问题重新定义为自然语言推理任务。
  • 分层摘要在文件、目录、仓库三个层级构建上下文感知的摘要。
  • 两阶段搜索方法:第一阶段路由Bug报告到相关仓库,第二阶段在仓库内定位。
  • 在DNEXT Technology的企业级项目上验证了46个仓库和110万行代码。
  • 分层摘要避免了直接将代码输入LLM,先转换为自然语言摘要。
  • 两阶段搜索方法提高了定位的速度和准确性。
  • 研究创新在于重新定义问题,采用NL-to-NL搜索。
  • 开发者建议:系统化方法定位Bug,使用自然语言摘要,分层思考。
  • 企业级验证增强了研究的说服力,ICSE 2026值得关注。

延伸问答

微服务多仓库的Bug定位面临哪些挑战?

微服务多仓库的Bug定位面临代码分散在多个仓库和Bug报告为自然语言之间的语义鸿沟问题。

文章中提出了哪些方法来解决Bug定位问题?

文章提出了分层摘要和两阶段搜索的方法来解决Bug定位问题。

分层摘要的作用是什么?

分层摘要在文件、目录、仓库三个层级构建上下文感知的摘要,帮助避免直接将代码输入LLM。

两阶段搜索方法是如何工作的?

两阶段搜索方法首先将Bug报告路由到相关仓库,然后在仓库内进行精细定位。

这项研究在企业项目中取得了怎样的成果?

研究在DNEXT Technology的企业项目中验证了46个仓库和110万行代码,超越了GitHub Copilot和Cursor。

研究团队对开发者有什么建议?

研究团队建议开发者使用系统化的方法定位Bug,利用自然语言摘要进行分层思考。

➡️

继续阅读