💡
原文英文,约600词,阅读约需3分钟。
📝
内容提要
Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。在Terminal-Bench 2.0基准测试中得分61.7%,虽然仍落后于OpenAI的GPT-5.4(75.1%),但显示出快速追赶的潜力。Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。
🎯
关键要点
- Cursor公司发布了Composer 2,这是其第三代编码模型,性能超越Anthropic的Opus 4.6,成本更低。
- Composer 2在Terminal-Bench 2.0基准测试中得分61.7%,虽然仍落后于OpenAI的GPT-5.4(75.1%),但显示出快速追赶的潜力。
- Composer 2采用自我总结的训练技术,显著提高了长任务表现,减少了50%的压缩错误。
- Composer 2的训练方法称为“自我总结”,使得模型能够从更长的任务轨迹中获取训练信号。
- Cursor的模型是模型无关的,开发者可以选择运行的模型或使用Cursor的自动模式,根据智能、速度和成本的权衡选择最佳模型。
❓
延伸问答
Composer 2的主要优势是什么?
Composer 2在编码基准测试中超越了Opus 4.6,并且成本更低。
Composer 2在Terminal-Bench 2.0基准测试中的得分是多少?
Composer 2在Terminal-Bench 2.0基准测试中得分61.7%。
Composer 2的训练技术是什么?
Composer 2采用了自我总结的训练技术,显著提高了长任务表现。
Composer 2的成本是多少?
Composer 2的成本为每百万输入令牌0.5美元,输出令牌2.5美元。
Composer 2与其他模型相比的成本如何?
与Opus 4.6的5美元/25美元和GPT-5.4的2.5美元/15美元相比,Composer 2的成本更低。
自我总结训练技术的优势是什么?
自我总结训练技术减少了50%的压缩错误,提高了模型在长任务中的表现。
➡️