「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

💡 原文中文,约5500字,阅读约需13分钟。
📝

内容提要

IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩,超越Opus-4.5和GPT-5.2。该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。

🎯

关键要点

  • IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩。
  • 该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。
  • IQuest-Coder-V1系列包括7B、14B和40B参数版本,提供Instruct和Thinking两种版本。
  • 40B参数规模的IQuest-Coder-V1额外提供Loop版本,显著降低计算成本,提高吞吐量。
  • 模型采用分组查询注意力(GQA)和支持128K上下文长度,适合处理完整代码仓库。
  • 训练策略为代码流多阶段训练,强调从代码演化过程中学习,捕捉软件逻辑的动态演变。
  • 九坤投资成立于2012年,是中国量化投资和高频交易的私募机构,管理规模在数百亿元人民币。
  • 九坤的团队成员大多毕业于知名高校,注重招募计算机、数学、物理等背景的人才。
  • IQuest-Coder团队的核心成员与多个知名论文的作者阵容重合度高,显示出其技术实力。