量子位 ·

大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色，修复bug成功率达到44%。该模型通过融合代码图模态，提升了代码理解和修复效率，减少了对复杂Agent的依赖，展现出强大的跨语言和跨项目能力。CGM的技术和代码已开源，提供灵活透明的解决方案。

🎯

🔎

CGM模型的成功展示了开源技术在软件工程领域的潜力。与传统闭源模型相比，CGM不仅在性能上表现优异，还提供了更高的透明度和可控性。这意味着开发者可以更灵活地调整和优化模型，降低了使用成本和技术壁垒。

CGM在多个编程语言和项目中表现出色，显示出其强大的跨语言能力。这一特性对于多样化的开发环境尤为重要，能够帮助团队在不同技术栈中快速定位和修复问题，提高整体开发效率。

CGM采用了两阶段的训练策略，结合了子图重构和噪声增强微调。这种方法不仅提升了模型对代码结构的理解能力，还增强了其在面对不完整或干扰信息时的鲁棒性。这为未来的模型训练提供了新的思路。

❓

CGM模型的修复bug成功率达到44%。

CGM模型通过融合代码图模态，减少对复杂Agent的依赖，从而提升了代码理解和修复效率。

CGM在SWE-bench Lite上排名第一，超越了所有开源模型。

CGM模型的训练分为两个阶段：子图重构预训练和噪声增强微调。

CGM模型展现出强大的跨语言和跨项目能力，能够处理大规模仓库级的Bug修复任务。

是的，CGM的技术和代码已开源，提供灵活透明的解决方案。

🏷️