大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜
💡
原文中文,约3700字,阅读约需9分钟。
📝
内容提要
蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色,修复bug成功率达到44%。该模型通过融合代码图模态,提升了代码理解和修复效率,减少了对复杂Agent的依赖,展现出强大的跨语言和跨项目能力。CGM的技术和代码已开源,提供灵活透明的解决方案。
🎯
关键要点
-
蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色,修复bug成功率达到44%。
-
CGM通过融合代码图模态,提升了代码理解和修复效率,减少了对复杂Agent的依赖。
-
CGM在所有开源模型中排名第一,超越了闭源模型的表现。
-
模型采用图-语言多模态,结合代码仓库的结构图与自然语言描述。
-
CGM的训练分为两个阶段:子图重构预训练和噪声增强微调。
-
推理阶段使用Graph-RAG框架,简化了传统Agent的工作流程。
-
CGM在多个基准测试中表现优异,展现出强大的跨语言和跨项目能力。
-
CGM的技术和代码已开源,为开发者提供灵活透明的解决方案。
❓
延伸问答
CGM模型的修复bug成功率是多少?
CGM模型的修复bug成功率达到44%。
CGM模型是如何提升代码理解和修复效率的?
CGM模型通过融合代码图模态,减少对复杂Agent的依赖,从而提升了代码理解和修复效率。
CGM模型在开源模型中的排名如何?
CGM在SWE-bench Lite上排名第一,超越了所有开源模型。
CGM模型的训练过程分为几个阶段?
CGM模型的训练分为两个阶段:子图重构预训练和噪声增强微调。
CGM模型如何处理跨语言和跨项目的任务?
CGM模型展现出强大的跨语言和跨项目能力,能够处理大规模仓库级的Bug修复任务。
CGM模型的技术和代码是否开源?
是的,CGM的技术和代码已开源,提供灵活透明的解决方案。
➡️