大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜

💡 原文中文,约3700字,阅读约需9分钟。
📝

内容提要

蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色,修复bug成功率达到44%。该模型通过融合代码图模态,提升了代码理解和修复效率,减少了对复杂Agent的依赖,展现出强大的跨语言和跨项目能力。CGM的技术和代码已开源,提供灵活透明的解决方案。

🎯

关键要点

  • 蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色,修复bug成功率达到44%。
  • CGM通过融合代码图模态,提升了代码理解和修复效率,减少了对复杂Agent的依赖。
  • CGM在所有开源模型中排名第一,超越了闭源模型的表现。
  • 模型采用图-语言多模态,结合代码仓库的结构图与自然语言描述。
  • CGM的训练分为两个阶段:子图重构预训练和噪声增强微调。
  • 推理阶段使用Graph-RAG框架,简化了传统Agent的工作流程。
  • CGM在多个基准测试中表现优异,展现出强大的跨语言和跨项目能力。
  • CGM的技术和代码已开源,为开发者提供灵活透明的解决方案。
➡️

继续阅读