Cursor: 以每秒 1000 个 Token 的速度编辑文件

Cursor: 以每秒 1000 个 Token 的速度编辑文件

💡 原文中文,约5700字,阅读约需14分钟。
📝

内容提要

一种新模型实现每秒1000个tokens的高效代码编辑,解决了现有模型在大规模编辑中的低效和不准确问题。该模型通过“规划”和“应用”两个阶段,在速度和准确性上超越了GPT-4,显著提升了代码编辑效率。

🎯

关键要点

  • 一种新模型实现每秒1000个tokens的高效代码编辑。

  • 现有模型在大规模编辑中表现不佳,存在懒惰、不准确和高延迟的问题。

  • 新模型通过规划和应用两个阶段提升代码编辑效率。

  • fast-apply模型在准确性和速度上超越了GPT-4和GPT-4o。

  • 模型使用70b大小的speculative edits变体进行推理,速度达到约1000 tokens/s。

  • 评估基于450个完整文件编辑任务,使用Claude-3 Opus作为打分模型。

  • Claude系列模型在输出完整代码方面表现优于GPT-4。

  • 速度测量定义为重写的字符数与总重写耗时的比值。

  • 模型重写整个文件而非输出diff,因diff格式处理困难。

  • 训练过程中使用合成数据和真实数据混合,优化模型性能。

  • 推测式编辑算法带来最高9倍的速度提升。

  • 未来方向包括长上下文训练、知识蒸馏和提高准确率。

  • fast-apply功能是构建复杂代码生成系统的重要组成部分。

  • Anysphere正在招聘研究工程师和软件工程师。

➡️

继续阅读