量子位 ·

12秒生成1万token！谷歌推出文本「扩散模型」Gemini Diffusion，研究员：演示都得降速看

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

谷歌的Gemini Diffusion模型利用扩散技术，在12秒内生成1万tokens，速度比传统模型快2000倍。该模型通过逐步优化噪声生成文本，支持非因果推理，提升生成质量和一致性。

🎯

🔎

Gemini Diffusion模型通过逐步优化噪声生成文本，打破了传统自回归模型的限制。这种方法不仅提升了生成速度，还提高了文本的一致性和质量，尤其在复杂任务如数学和代码生成中表现突出。

与自回归模型相比，Gemini Diffusion支持非因果推理，允许模型在生成过程中进行错误纠正。这一特性使得模型能够更灵活地处理复杂问题，提升了生成的准确性和连贯性。

Gemini Diffusion的推出标志着语言模型技术的一个重要进步。随着扩散技术的不断发展，未来可能会出现更多基于此技术的混合模型，进一步推动自然语言处理领域的创新。

❓

Gemini Diffusion模型每秒能生成2000个token，12秒内可生成1万tokens。

Gemini Diffusion通过逐步优化噪声生成文本，而传统自回归模型是从左到右逐步预测下一个词。

该模型支持非因果推理，能够在生成过程中进行错误纠正，从而提升生成质量和一致性。

该模型在编辑、数学和代码环境中表现出色，能够处理复杂的推理问题。

扩散模型允许并行或迭代式去噪，消除了严格的时序因果关系，从而提高生成速度和灵活性。

未来可能会出现更多基于扩散技术的混合模型，例如双向模型LLaDA。

🏷️