量子位 ·

扩散语言模型写代码！速度比自回归快10倍

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

Mercury是一种高效的扩散语言模型，生成代码速度比传统模型快10倍，达到1109 tokens/秒。它采用“从噪声到结构化输出”的方法，具备动态纠错能力，提升生成灵活性。Mercury结合Transformer架构，优化硬件利用，解决CI/CD速度瓶颈。

🎯

🔎

Mercury模型通过扩散技术实现了比传统自回归模型快10倍的代码生成速度，具有动态纠错能力和灵活性。然而，尽管生成速度显著提升，当前的持续集成/交付（CI/CD）能力仍可能成为瓶颈，影响开发效率。开发者需关注如何平衡生成速度与测试速度之间的矛盾。

Mercury通过并行化文本生成和动态去噪调度等技术，极大地提高了GPU的利用率，降低了训练和推理成本。特别是在H100 GPU上，模型的高吞吐量展示了其在硬件资源管理上的优势。开发者在选择模型时，应考虑其对硬件的适配性和资源需求。

Mercury的强大错误纠正能力使其在代码生成中能够实时检测和修正逻辑漏洞，这对于提高代码的准确性和可用性至关重要。开发者在使用该模型时，可以利用其动态修改功能，减少后期调试的时间和成本，提升整体开发效率。

❓

Mercury模型在H100 GPU上实现了1109 tokens/秒的生成速度，比传统模型快10倍。

Mercury模型在生成过程中能够动态修改之前的内容，具备强大的错误纠正能力。

Mercury采用“从噪声到结构化输出”的方法，能够一次性预测多个token，提高生成速度。

Mercury通过并行化文本生成、动态去噪调度和混合精度量化等技术高效利用硬件，降低训练和推理成本。

Mercury的开发团队包括来自斯坦福、UCLA和康奈尔大学的计算机教授，团队成员有丰富的研究和实习经历。

Mercury模型的超快响应速度可以显著缩短开发周期，但仍需解决与当前CI能力不匹配的问题。

🏷️