大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜

💡 原文中文,约3700字,阅读约需9分钟。
📝

内容提要

蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色,修复bug成功率达到44%。该模型通过融合代码图模态,提升了代码理解和修复效率,减少了对复杂Agent的依赖,展现出强大的跨语言和跨项目能力。CGM的技术和代码已开源,提供灵活透明的解决方案。

🎯

关键要点

  • 蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色,修复bug成功率达到44%。

  • CGM通过融合代码图模态,提升了代码理解和修复效率,减少了对复杂Agent的依赖。

  • CGM在所有开源模型中排名第一,超越了闭源模型的表现。

  • 模型采用图-语言多模态,结合代码仓库的结构图与自然语言描述。

  • CGM的训练分为两个阶段:子图重构预训练和噪声增强微调。

  • 推理阶段使用Graph-RAG框架,简化了传统Agent的工作流程。

  • CGM在多个基准测试中表现优异,展现出强大的跨语言和跨项目能力。

  • CGM的技术和代码已开源,为开发者提供灵活透明的解决方案。

延伸问答

CGM模型的修复bug成功率是多少?

CGM模型的修复bug成功率达到44%。

CGM模型是如何提升代码理解和修复效率的?

CGM模型通过融合代码图模态,减少对复杂Agent的依赖,从而提升了代码理解和修复效率。

CGM模型在开源模型中的排名如何?

CGM在SWE-bench Lite上排名第一,超越了所有开源模型。

CGM模型的训练过程分为几个阶段?

CGM模型的训练分为两个阶段:子图重构预训练和噪声增强微调。

CGM模型如何处理跨语言和跨项目的任务?

CGM模型展现出强大的跨语言和跨项目能力,能够处理大规模仓库级的Bug修复任务。

CGM模型的技术和代码是否开源?

是的,CGM的技术和代码已开源,提供灵活透明的解决方案。

➡️

继续阅读