The New Stack ·

准备好迎接更快的文本生成，使用扩散大型语言模型

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

Mercury是Inception Labs推出的首个商业化扩散大型语言模型，速度比传统模型快五倍，适合代码生成和企业自动化。该模型通过并行处理所有词汇，解决了自回归模型的延迟和成本问题，未来可能改变文本生成方式。

🎯

关键要点

Mercury是Inception Labs推出的首个商业化扩散大型语言模型，速度比传统模型快五倍。
传统的自回归模型逐个处理词汇，存在延迟和成本问题。
扩散模型通过并行处理所有词汇，解决了自回归模型的缺点。
Mercury在NVIDIA H100s上每秒可处理超过1000个词汇，运行成本更低。
Mercury Coder专门优化用于代码生成，速度比OpenAI的GPT-4o Mini快10倍。
扩散模型适合代码生成、企业自动化和对延迟敏感的应用场景。
未来，Mercury可能会引领从自回归模型向扩散模型的转变。

❓

延伸问答

Mercury模型的主要优势是什么？

Mercury模型比传统模型快五倍，且运行成本更低，适合代码生成和企业自动化。

扩散大型语言模型与自回归模型有什么区别？

扩散模型通过并行处理所有词汇，而自回归模型逐个处理，导致延迟和成本问题。

Mercury Coder的应用场景有哪些？

Mercury Coder适用于代码生成、企业自动化和对延迟敏感的应用场景。

Mercury模型的处理速度如何？

Mercury模型在NVIDIA H100s上每秒可处理超过1000个词汇，速度非常快。

使用扩散模型生成文本的潜在影响是什么？

扩散模型可能会降低推理成本，并在未来提升性能，改变文本生成方式。

Mercury Coder与OpenAI的GPT-4o Mini相比如何？

Mercury Coder在测试中速度比OpenAI的GPT-4o Mini快10倍。

🏷️

继续阅读

微软的Xbox模式现已在所有Windows 11 PC上可用
微软已将Xbox模式推向所有Windows 11 PC，提供类似Steam大屏模式的全屏界面，旨在缩小Windows与Xbox主机之间的差距。用户需安装最...
Meta威胁称，如果被迫进行“技术上不可行”的更改，将撤回其在新墨西哥州的应用程序
Meta公司表示，如果新墨西哥州检察长的要求得以实施，他们可能会撤回Facebook、Instagram和WhatsApp。检察长要求的多项变更被Meta...
通过《Saros》，Housemarque主张以不同的方式开发次世代游戏
芬兰开发商Housemarque在新作《Saros》中探索了不同于传统AAA游戏的设计理念，强调游戏玩法而非视觉真实。玩家将扮演阿尔君，调查失踪的矿工，体...
马斯克诉奥特曼案中迄今揭示的所有证据
马斯克与奥特曼的诉讼揭示了OpenAI早期的内部邮件和文件。马斯克指控奥特曼等人违反慈善信托，质疑OpenAI是否偏离了其造福全人类的初衷。邮件显示，马斯...
通过语义元数据Delta共享在Databricks中解锁SAP业务上下文
SAP Business Data Cloud与Databricks Unity Catalog的合作实现了语义元数据的自动同步，使SAP数据更易理解和发...
埃隆·马斯克确认xAI使用OpenAI的模型来训练Grok
埃隆·马斯克在加州法庭作证称，他的AI初创公司xAI使用了OpenAI的模型来提升技术。他提到“模型蒸馏”是行业常见做法，允许大型AI模型作为“教师”训练...