Cursor的Composer 2在编码基准测试中超越Opus 4.6,成本却低得多

Cursor的Composer 2在编码基准测试中超越Opus 4.6,成本却低得多

💡 原文英文,约600词,阅读约需3分钟。
📝

内容提要

Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。

🎯

关键要点

  • Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。

  • Composer 2在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。

  • Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。

  • 新模型的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元,快速模式的成本是常规模式的三倍。

  • Composer 2是Cursor自2025年10月以来发布的第三个Composer版本,之前的版本在性能上有所落后。

延伸问答

Composer 2与Opus 4.6相比有哪些优势?

Composer 2在编码基准测试中超越了Opus 4.6,并且成本更低。

Composer 2的训练技术是什么?

Composer 2采用了自我总结的训练技术,显著提高了长任务表现。

Composer 2的成本是多少?

Composer 2的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元。

Composer 2在Terminal-Bench 2.0基准测试中的得分是多少?

Composer 2在Terminal-Bench 2.0基准测试中得分61.7%。

Cursor公司之前发布了多少个Composer版本?

自2025年10月以来,Cursor公司发布了三个Composer版本。

Composer 2如何处理长任务的上下文信息?

Composer 2通过自我总结的方式在训练中压缩上下文,减少了50%的压缩错误。

➡️

继续阅读