Cursor的Composer 2在编码基准测试中超越Opus 4.6,成本却低得多

Cursor的Composer 2在编码基准测试中超越Opus 4.6,成本却低得多

💡 原文英文,约600词,阅读约需3分钟。
📝

内容提要

Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。

🎯

关键要点

  • Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。

  • Composer 2在Terminal-Bench 2.0基准测试中得分61.7%,尽管仍落后于OpenAI的GPT-5.4,但显示出Cursor迅速追赶的能力。

  • Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。

  • 新模型的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元,快速模式的成本是常规模式的三倍。

  • Composer 2是Cursor自2025年10月以来发布的第三个Composer版本,之前的版本在性能上有所落后。

🔎

延伸解读

Composer 2的成本优势

Composer 2在输入和输出令牌的成本上显著低于竞争对手Opus 4.6和GPT-5.4,分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元。这使得开发者在选择编码模型时,可以在保持性能的同时,降低项目成本,尤其适合预算有限的团队。

自我总结训练技术的创新

Composer 2采用的自我总结训练技术,能够有效处理长任务,减少了50%的压缩错误。这一创新不仅提升了模型的长任务表现,还解决了传统方法中信息遗失的问题,为需要处理复杂任务的开发者提供了更可靠的工具。

市场竞争态势

尽管Composer 2在性能上超越了Opus 4.6,但仍落后于OpenAI的GPT-5.4。这表明,Cursor在追赶竞争对手的过程中,仍需不断优化和提升其模型性能,以在快速发展的AI市场中占据一席之地。

延伸问答

Composer 2与Opus 4.6相比有哪些优势?

Composer 2在编码基准测试中超越了Opus 4.6,并且成本更低。

Composer 2的训练技术是什么?

Composer 2采用了自我总结的训练技术,显著提高了长任务表现。

Composer 2的成本是多少?

Composer 2的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元。

Composer 2在Terminal-Bench 2.0基准测试中的得分是多少?

Composer 2在Terminal-Bench 2.0基准测试中得分61.7%。

Cursor公司之前发布了多少个Composer版本?

自2025年10月以来,Cursor公司发布了三个Composer版本。

Composer 2如何处理长任务的上下文信息?

Composer 2通过自我总结的方式在训练中压缩上下文,减少了50%的压缩错误。

🏷️

标签

➡️

继续阅读