量子位 ·

大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色，修复bug成功率达到44%。该模型通过融合代码图模态，提升了代码理解和修复效率，减少了对复杂Agent的依赖，展现出强大的跨语言和跨项目能力。CGM的技术和代码已开源，提供灵活透明的解决方案。

🎯

关键要点

蚂蚁推出的开源模型CGM在SWE-bench Lite上表现出色，修复bug成功率达到44%。
CGM通过融合代码图模态，提升了代码理解和修复效率，减少了对复杂Agent的依赖。
CGM在所有开源模型中排名第一，超越了闭源模型的表现。
模型采用图-语言多模态，结合代码仓库的结构图与自然语言描述。
CGM的训练分为两个阶段：子图重构预训练和噪声增强微调。
推理阶段使用Graph-RAG框架，简化了传统Agent的工作流程。
CGM在多个基准测试中表现优异，展现出强大的跨语言和跨项目能力。
CGM的技术和代码已开源，为开发者提供灵活透明的解决方案。

🏷️

继续阅读

【Rust日报】2026-03-03 Saikuro - 跨语言IPC库
Saikuro是一个跨语言的IPC库，支持Rust、TypeScript、Python和C#等语言，允许开发者用一种语言编写函数并在其他语言中调用。其核心...
早报｜小米发布手机版龙虾/M5 Max跑分曝光：或登顶Mac性能榜/魏建军就魏牌海报抄袭道歉
M5 Max芯片的早期跑分显示其单核和多核性能超越前代，可能成为Mac性能之最。甲骨文因AI数据中心扩张面临现金流压力，计划裁员数千人。苹果MacBook...
如何使用GitHub安全实验室的开源AI驱动框架扫描安全漏洞
我们利用GitHub安全实验室的任务流代理，成功发现80多个开源项目中的高影响力安全漏洞，主要涉及授权绕过和信息泄露。新任务流提高了结果验证和报告发布的效...
Anthropic与OpenAI争夺最佳开源维护者
如果Anthropic项目招募到10,000名开发者，预计价值约1200万美元。对于刚融资300亿美元的公司而言，这笔费用不算高，但能获得维护者的支持，推...
我们的开源AI模型SpeciesNet如何助力野生动物保护
SpeciesNet是一个AI模型，能够自动识别近2500种动物，帮助生物学家和保护者快速分析相机捕捉的数据。自2019年起，该工具在多个国家的项目中应用...
融合语言与智能：天津外国语大学与文心大模型的务实探索
基于PaddleFormers的DeepSeek-V3模型微调与优化实践取得显著成果，确保e_score_correction_bias参数仅用于门控权重...

大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜

内容提要

关键要点

标签

继续阅读