内容提要
Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。
关键要点
-
Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。
-
Composer 2在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。
-
Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。
-
新模型的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元,快速模式的成本是常规模式的三倍。
-
Composer 2是Cursor自2025年10月以来发布的第三个Composer版本,之前的版本在性能上有所落后。
延伸解读
Composer 2的成本优势
Composer 2在输入和输出令牌的成本上显著低于竞争对手Opus 4.6和GPT-5.4,分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元。这使得开发者在选择编码模型时,可以在保持性能的同时,降低项目成本,尤其适合预算有限的团队。
自我总结训练技术的创新
Composer 2采用的自我总结训练技术,能够有效处理长任务,减少了50%的压缩错误。这一创新不仅提升了模型的长任务表现,还解决了传统方法中信息遗失的问题,为需要处理复杂任务的开发者提供了更可靠的工具。
市场竞争态势
尽管Composer 2在性能上超越了Opus 4.6,但仍落后于OpenAI的GPT-5.4。这表明,Cursor在追赶竞争对手的过程中,仍需不断优化和提升其模型性能,以在快速发展的AI市场中占据一席之地。
延伸问答
Composer 2与Opus 4.6相比有哪些优势?
Composer 2在编码基准测试中超越了Opus 4.6,并且成本更低。
Composer 2的训练技术是什么?
Composer 2采用了自我总结的训练技术,显著提高了长任务表现。
Composer 2的成本是多少?
Composer 2的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元。
Composer 2在Terminal-Bench 2.0基准测试中的得分是多少?
Composer 2在Terminal-Bench 2.0基准测试中得分61.7%。
Cursor公司之前发布了多少个Composer版本?
自2025年10月以来,Cursor公司发布了三个Composer版本。
Composer 2如何处理长任务的上下文信息?
Composer 2通过自我总结的方式在训练中压缩上下文,减少了50%的压缩错误。