宝玉的分享 ·

Cursor: 以每秒 1000 个 Token 的速度编辑文件

💡 原文中文，约5700字，阅读约需14分钟。

📝

内容提要

一种新模型实现每秒1000个tokens的高效代码编辑，解决了现有模型在大规模编辑中的低效和不准确问题。该模型通过“规划”和“应用”两个阶段，在速度和准确性上超越了GPT-4，显著提升了代码编辑效率。

🎯

关键要点

一种新模型实现每秒1000个tokens的高效代码编辑。
现有模型在大规模编辑中表现不佳，存在懒惰、不准确和高延迟的问题。
新模型通过规划和应用两个阶段提升代码编辑效率。
fast-apply模型在准确性和速度上超越了GPT-4和GPT-4o。
模型使用70b大小的speculative edits变体进行推理，速度达到约1000 tokens/s。
评估基于450个完整文件编辑任务，使用Claude-3 Opus作为打分模型。
Claude系列模型在输出完整代码方面表现优于GPT-4。
速度测量定义为重写的字符数与总重写耗时的比值。
模型重写整个文件而非输出diff，因diff格式处理困难。
训练过程中使用合成数据和真实数据混合，优化模型性能。
推测式编辑算法带来最高9倍的速度提升。
未来方向包括长上下文训练、知识蒸馏和提高准确率。
fast-apply功能是构建复杂代码生成系统的重要组成部分。
Anysphere正在招聘研究工程师和软件工程师。

🔎

延伸解读

新模型的优势与应用场景

新模型通过规划和应用两个阶段，显著提升了代码编辑的速度和准确性，尤其适用于需要频繁修改的复杂代码场景。与现有模型相比，它能有效减少程序员的工作中断，提高整体工作效率。

推测式编辑的技术突破

推测式编辑算法为模型带来了最高9倍的速度提升，这一技术的成功应用使得在处理大规模代码时，模型能够更快速地生成完整文件，而非依赖于难以处理的diff格式，降低了出错率。

未来发展方向的潜力

未来，长上下文训练和知识蒸馏将是提升模型性能的关键方向。这些技术的进步可能使得模型在处理更大文件时，依然保持高效和准确，为开发者提供更强大的工具支持。

❓

延伸问答

新模型的编辑速度有多快？

新模型的编辑速度达到每秒1000个tokens。

现有模型在大规模编辑中存在哪些问题？

现有模型在大规模编辑中表现不佳，主要存在懒惰、不准确和高延迟的问题。

新模型是如何提高代码编辑效率的？

新模型通过规划和应用两个阶段来提升代码编辑效率。

推测式编辑算法带来了什么样的速度提升？

推测式编辑算法带来了最高9倍的速度提升。

新模型在准确性上与GPT-4相比如何？

新模型在准确性上超越了GPT-4和GPT-4o。

未来的研究方向有哪些？

未来方向包括长上下文训练、知识蒸馏和提高准确率。

🏷️

标签

GPT-4 cursor 代码编辑效率新模型规划与应用

➡️

继续阅读

OpenAI, Anthropic, and Cursor all localized pricing for India. Only two focused on value.
Cursor is the latest AI company to target India with localized pricing, annou...
PopDrop：随时呼出，Windows 文件中转站（不，终点站）
问题：当你正在微信聊天，突然需要发送一份近期的工作文件。以前的操作：先离开聊天窗口，切到文件管理器，找到文件，再把它拖回聊天窗口。使用 PopDro...
奇妙的旋转浮空大冒险《黄油猫》今日上线蒸汽平台
猫猫落地总是能四脚朝下，吐司永远是抹着黄油的那面拍在地上，那么黄油吐司加猫猫呢？永不落地，旋转起来！好评如潮的平台解谜游戏《黄油猫》今日（7月30日）正式...
音视频中台的关键能力有哪些
选音视频中台的时候，厂商给你的功能清单可能长达几十项。但真正决定中台能不能用得起来、用得久的，其实集中在五个维度的核心能力上。本文以即构(ZEGO)的音视...
Qt Creator 20.0.1 released
We are happy to announce the release of Qt Creator 20.0.1! The release improv...
自研音视频中台和购买哪个更划算
自研音视频中台和购买哪个更划算？这是选型时最常被问的问题，也是最容易被厂商用话术带偏的问题。本文不替你做决定，而是把自研和购买的完整成本构成、适用条件和隐...