The New Stack ·

Cursor的Composer 2在编码基准测试中超越Opus 4.6，成本却低得多

💡 原文英文，约600词，阅读约需3分钟。

📝

内容提要

Cursor公司发布了Composer 2，这是其第三代编码模型，性能超越Anthropic的Opus 4.6，成本更低。在Terminal-Bench 2.0基准测试中得分61.7%，尽管仍落后于OpenAI的GPT-5.4，但显示出Cursor迅速追赶的能力。Composer 2采用自我总结的训练技术，显著提高了长任务表现，减少了50%的压缩错误。

🎯

关键要点

Cursor公司发布了Composer 2，这是其第三代编码模型，性能超越Anthropic的Opus 4.6，成本更低。
Composer 2在Terminal-Bench 2.0基准测试中得分61.7%，尽管仍落后于OpenAI的GPT-5.4，但显示出Cursor迅速追赶的能力。
Composer 2采用自我总结的训练技术，显著提高了长任务表现，减少了50%的压缩错误。
新模型的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元，快速模式的成本是常规模式的三倍。
Composer 2是Cursor自2025年10月以来发布的第三个Composer版本，之前的版本在性能上有所落后。

🔎

延伸解读

Composer 2的成本优势

Composer 2在输入和输出令牌的成本上显著低于竞争对手Opus 4.6和GPT-5.4，分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元。这使得开发者在选择编码模型时，可以在保持性能的同时，降低项目成本，尤其适合预算有限的团队。

自我总结训练技术的创新

Composer 2采用的自我总结训练技术，能够有效处理长任务，减少了50%的压缩错误。这一创新不仅提升了模型的长任务表现，还解决了传统方法中信息遗失的问题，为需要处理复杂任务的开发者提供了更可靠的工具。

市场竞争态势

尽管Composer 2在性能上超越了Opus 4.6，但仍落后于OpenAI的GPT-5.4。这表明，Cursor在追赶竞争对手的过程中，仍需不断优化和提升其模型性能，以在快速发展的AI市场中占据一席之地。

❓

延伸问答

Composer 2与Opus 4.6相比有哪些优势？

Composer 2在编码基准测试中超越了Opus 4.6，并且成本更低。

Composer 2的训练技术是什么？

Composer 2采用了自我总结的训练技术，显著提高了长任务表现。

Composer 2的成本是多少？

Composer 2的输入和输出成本分别为每百万个输入令牌0.5美元和每百万个输出令牌2.5美元。

Composer 2在Terminal-Bench 2.0基准测试中的得分是多少？

Composer 2在Terminal-Bench 2.0基准测试中得分61.7%。

Cursor公司之前发布了多少个Composer版本？

自2025年10月以来，Cursor公司发布了三个Composer版本。

Composer 2如何处理长任务的上下文信息？

Composer 2通过自我总结的方式在训练中压缩上下文，减少了50%的压缩错误。

🏷️