「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

💡 原文中文,约5500字,阅读约需13分钟。
📝

内容提要

IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩,超越Opus-4.5和GPT-5.2。该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。

🎯

关键要点

  • IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩。

  • 该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。

  • IQuest-Coder-V1系列包括7B、14B和40B参数版本,提供Instruct和Thinking两种版本。

  • 40B参数规模的IQuest-Coder-V1额外提供Loop版本,显著降低计算成本,提高吞吐量。

  • 模型采用分组查询注意力(GQA)和支持128K上下文长度,适合处理完整代码仓库。

  • 训练策略为代码流多阶段训练,强调从代码演化过程中学习,捕捉软件逻辑的动态演变。

  • 九坤投资成立于2012年,是中国量化投资和高频交易的私募机构,管理规模在数百亿元人民币。

  • 九坤的团队成员大多毕业于知名高校,注重招募计算机、数学、物理等背景的人才。

  • IQuest-Coder团队的核心成员与多个知名论文的作者阵容重合度高,显示出其技术实力。

延伸问答

IQuest-Coder-V1模型的主要特点是什么?

IQuest-Coder-V1模型专注于代码生成与理解,支持长上下文,具有多种参数版本(7B、14B、40B),并提供Instruct和Thinking两种版本。

IQuest-Coder-V1在SWE-Bench中的表现如何?

IQuest-Coder-V1的40B参数版本在SWE-Bench中取得了81.4%的成绩,超越了Opus-4.5和GPT-5.2。

IQuest-Coder-V1的训练策略是什么?

IQuest-Coder-V1采用代码流多阶段训练策略,强调从代码演化过程中学习,捕捉软件逻辑的动态变化。

IQuest-Coder-V1的Loop版本有什么优势?

Loop版本显著降低计算成本,提高吞吐量,且在参数利用效率上表现优异。

九坤投资公司是什么背景?

九坤投资成立于2012年,是中国量化投资和高频交易的私募机构,管理规模在数百亿元人民币,团队成员多毕业于知名高校。

IQuest-Coder-V1支持哪些上下文长度?

IQuest-Coder-V1原生支持128K上下文长度,适合处理完整代码仓库和大规模工程上下文。

➡️

继续阅读