大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜
💡
原文中文,约3700字,阅读约需9分钟。
📝
内容提要
蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色,修复bug成功率达到44%。该模型通过融合代码图模态,提升了代码理解和修复效率,减少了对复杂Agent的依赖,展现出强大的跨语言和跨项目能力。CGM的技术和代码已开源,提供灵活透明的解决方案。
🎯
关键要点
- 蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色,修复bug成功率达到44%。
- CGM通过融合代码图模态,提升了代码理解和修复效率,减少了对复杂Agent的依赖。
- CGM在所有开源模型中排名第一,超越了闭源模型的表现。
- 模型采用图-语言多模态,结合代码仓库的结构图与自然语言描述。
- CGM的训练分为两个阶段:子图重构预训练和噪声增强微调。
- 推理阶段使用Graph-RAG框架,简化了传统Agent的工作流程。
- CGM在多个基准测试中表现优异,展现出强大的跨语言和跨项目能力。
- CGM的技术和代码已开源,为开发者提供灵活透明的解决方案。
➡️