不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果

💡 原文中文,约3300字,阅读约需8分钟。
📝

内容提要

Inception Labs 发布了首个商业级扩散大型语言模型 Mercury,速度超过每秒1000个token,性能优于现有模型,显著提高生成效率并降低成本,受到广泛关注。

🎯

关键要点

  • Inception Labs 发布了首个商业级扩散大型语言模型 Mercury,速度超过每秒1000个token。

  • Mercury 的性能优于现有模型,显著提高生成效率并降低成本。

  • Mercury Coder 是 Inception Labs 向公众开放的第一个 dLLM,速度比当前一代语言模型快 5 到 10 倍。

  • 扩散模型的生成过程是从粗到细,能够纠正错误和幻觉,适用于文本和代码等离散数据。

  • Mercury Coder 在标准编码基准测试中超越了 GPT-4o Mini 和 Claude 3.5 Haiku 等自回归模型。

  • Mercury Coder 的代码补全功能在 Copilot Arena 上表现出色,速度比 GPT-4o Mini 快约 4 倍。

  • Mercury Coder 目前已上线,可公开试用,并为企业用户提供 API 和内部部署服务。

延伸问答

Mercury 模型的主要特点是什么?

Mercury 模型的主要特点是速度超过每秒1000个token,性能优于现有模型,显著提高生成效率并降低成本。

Mercury Coder 与自回归模型相比有什么优势?

Mercury Coder 在速度上比自回归模型快5到10倍,并且在标准编码基准测试中超越了如GPT-4o Mini等模型。

扩散模型的生成过程是怎样的?

扩散模型的生成过程是从粗到细,输出从纯噪声开始,通过去噪步骤逐步细化,能够纠正错误和幻觉。

Mercury Coder 适用于哪些用例?

Mercury Coder 支持多种用例,包括RAG、工具使用和智能体工作流。

Inception Labs 是什么样的公司?

Inception Labs 是一家创业公司,创始人之一是扩散模型的发明者Stefano Ermon,专注于开发高效的语言模型。

Mercury Coder 目前的使用情况如何?

Mercury Coder 已上线并可公开试用,同时为企业用户提供API和内部部署服务。

🏷️

标签

➡️

继续阅读