内容提要
Inception Labs 发布了首个商业级扩散大型语言模型 Mercury,速度超过每秒1000个token,性能优于现有模型,显著提高生成效率并降低成本,受到广泛关注。
关键要点
-
Inception Labs 发布了首个商业级扩散大型语言模型 Mercury,速度超过每秒1000个token。
-
Mercury 的性能优于现有模型,显著提高生成效率并降低成本。
-
Mercury Coder 是 Inception Labs 向公众开放的第一个 dLLM,速度比当前一代语言模型快 5 到 10 倍。
-
扩散模型的生成过程是从粗到细,能够纠正错误和幻觉,适用于文本和代码等离散数据。
-
Mercury Coder 在标准编码基准测试中超越了 GPT-4o Mini 和 Claude 3.5 Haiku 等自回归模型。
-
Mercury Coder 的代码补全功能在 Copilot Arena 上表现出色,速度比 GPT-4o Mini 快约 4 倍。
-
Mercury Coder 目前已上线,可公开试用,并为企业用户提供 API 和内部部署服务。
延伸问答
Mercury 模型的主要特点是什么?
Mercury 模型的主要特点是速度超过每秒1000个token,性能优于现有模型,显著提高生成效率并降低成本。
Mercury Coder 与自回归模型相比有什么优势?
Mercury Coder 在速度上比自回归模型快5到10倍,并且在标准编码基准测试中超越了如GPT-4o Mini等模型。
扩散模型的生成过程是怎样的?
扩散模型的生成过程是从粗到细,输出从纯噪声开始,通过去噪步骤逐步细化,能够纠正错误和幻觉。
Mercury Coder 适用于哪些用例?
Mercury Coder 支持多种用例,包括RAG、工具使用和智能体工作流。
Inception Labs 是什么样的公司?
Inception Labs 是一家创业公司,创始人之一是扩散模型的发明者Stefano Ermon,专注于开发高效的语言模型。
Mercury Coder 目前的使用情况如何?
Mercury Coder 已上线并可公开试用,同时为企业用户提供API和内部部署服务。