「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2
💡
原文中文,约5500字,阅读约需13分钟。
📝
内容提要
IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩,超越Opus-4.5和GPT-5.2。该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。
🎯
关键要点
- IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩。
- 该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。
- IQuest-Coder-V1系列包括7B、14B和40B参数版本,提供Instruct和Thinking两种版本。
- 40B参数规模的IQuest-Coder-V1额外提供Loop版本,显著降低计算成本,提高吞吐量。
- 模型采用分组查询注意力(GQA)和支持128K上下文长度,适合处理完整代码仓库。
- 训练策略为代码流多阶段训练,强调从代码演化过程中学习,捕捉软件逻辑的动态演变。
- 九坤投资成立于2012年,是中国量化投资和高频交易的私募机构,管理规模在数百亿元人民币。
- 九坤的团队成员大多毕业于知名高校,注重招募计算机、数学、物理等背景的人才。
- IQuest-Coder团队的核心成员与多个知名论文的作者阵容重合度高,显示出其技术实力。