内容提要
Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。
关键要点
-
Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。
-
Composer 2在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。
-
Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。
-
新模型的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元,快速模式的成本是常规模式的三倍。
-
Composer 2是Cursor自2025年10月以来发布的第三个Composer版本,之前的版本在性能上有所落后。
延伸问答
Composer 2与Opus 4.6相比有哪些优势?
Composer 2在编码基准测试中超越了Opus 4.6,并且成本更低。
Composer 2的训练技术是什么?
Composer 2采用了自我总结的训练技术,显著提高了长任务表现。
Composer 2的成本是多少?
Composer 2的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元。
Composer 2在Terminal-Bench 2.0基准测试中的得分是多少?
Composer 2在Terminal-Bench 2.0基准测试中得分61.7%。
Cursor公司之前发布了多少个Composer版本?
自2025年10月以来,Cursor公司发布了三个Composer版本。
Composer 2如何处理长任务的上下文信息?
Composer 2通过自我总结的方式在训练中压缩上下文,减少了50%的压缩错误。