「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2
内容提要
IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩,超越Opus-4.5和GPT-5.2。该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。
关键要点
-
IQuest-Coder-V1是九坤投资推出的开源大模型,40B参数版本在SWE-Bench中取得81.4%的成绩。
-
该模型专注于代码生成与理解,支持长上下文,适用于真实软件工程场景。
-
IQuest-Coder-V1系列包括7B、14B和40B参数版本,提供Instruct和Thinking两种版本。
-
40B参数规模的IQuest-Coder-V1额外提供Loop版本,显著降低计算成本,提高吞吐量。
-
模型采用分组查询注意力(GQA)和支持128K上下文长度,适合处理完整代码仓库。
-
训练策略为代码流多阶段训练,强调从代码演化过程中学习,捕捉软件逻辑的动态演变。
-
九坤投资成立于2012年,是中国量化投资和高频交易的私募机构,管理规模在数百亿元人民币。
-
九坤的团队成员大多毕业于知名高校,注重招募计算机、数学、物理等背景的人才。
-
IQuest-Coder团队的核心成员与多个知名论文的作者阵容重合度高,显示出其技术实力。
延伸问答
IQuest-Coder-V1模型的主要特点是什么?
IQuest-Coder-V1模型专注于代码生成与理解,支持长上下文,具有多种参数版本(7B、14B、40B),并提供Instruct和Thinking两种版本。
IQuest-Coder-V1在SWE-Bench中的表现如何?
IQuest-Coder-V1的40B参数版本在SWE-Bench中取得了81.4%的成绩,超越了Opus-4.5和GPT-5.2。
IQuest-Coder-V1的训练策略是什么?
IQuest-Coder-V1采用代码流多阶段训练策略,强调从代码演化过程中学习,捕捉软件逻辑的动态变化。
IQuest-Coder-V1的Loop版本有什么优势?
Loop版本显著降低计算成本,提高吞吐量,且在参数利用效率上表现优异。
九坤投资公司是什么背景?
九坤投资成立于2012年,是中国量化投资和高频交易的私募机构,管理规模在数百亿元人民币,团队成员多毕业于知名高校。
IQuest-Coder-V1支持哪些上下文长度?
IQuest-Coder-V1原生支持128K上下文长度,适合处理完整代码仓库和大规模工程上下文。