机器之心 ·

不要自回归！扩散模型作者创业，首个商业级扩散LLM来了，编程秒出结果

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

Inception Labs 发布了首个商业级扩散大型语言模型 Mercury，速度超过每秒1000个token，性能优于现有模型，显著提高生成效率并降低成本，受到广泛关注。

🎯

🔎

Mercury 采用扩散模型的生成方式，从噪声逐步去噪，能够在推理和结构化响应方面表现更佳。这种方法不仅提高了生成速度，还能有效纠正错误和幻觉，适用于文本和代码等离散数据，显示出扩散模型在语言生成领域的潜力。

Mercury Coder 的高效性能使其在企业应用中具有广泛的前景。其提供的 API 和内部部署服务，能够帮助企业以更低的成本实现高质量的 AI 解决方案，尤其在编程和自动化任务中，提升工作效率。

与传统自回归模型相比，Mercury Coder 在速度和效率上具有显著优势。自回归模型需要逐个生成 token，而 Mercury 则通过并行处理实现了更快的响应速度，这使得它在处理复杂任务时更具竞争力。

❓

Mercury 模型的主要特点是速度超过每秒1000个token，性能优于现有模型，显著提高生成效率并降低成本。

Mercury Coder 在速度上比自回归模型快5到10倍，并且在标准编码基准测试中超越了如GPT-4o Mini等模型。

扩散模型的生成过程是从粗到细，输出从纯噪声开始，通过去噪步骤逐步细化，能够纠正错误和幻觉。

Mercury Coder 支持多种用例，包括RAG、工具使用和智能体工作流。

Inception Labs 是一家创业公司，创始人之一是扩散模型的发明者Stefano Ermon，专注于开发高效的语言模型。

Mercury Coder 已上线并可公开试用，同时为企业用户提供API和内部部署服务。

🏷️