HyperAI超神经 ·

在线教程丨最高4倍生成速度提升，DiffusionGemma可同时生成整块文本，基于多轮并行去噪持续优化结果

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

Google于6月11日开源了基于离散扩散技术的文本生成模型DiffusionGemma。该模型具有高效的生成速度，能够以最高1100 Token/s的速度同时生成整个文本块，采用26B参数的混合专家设计，支持256K Token长上下文和多模态输入。尽管标准版Gemma 4在生成质量上更优，DiffusionGemma展示了新的发展方向。

🎯

关键要点

Google于6月11日开源了基于离散扩散技术的文本生成模型DiffusionGemma。
DiffusionGemma能够以最高1100 Token/s的速度同时生成整个文本块，生成速度提升最高可达4倍。
该模型采用26B参数的混合专家设计，推理过程中仅激活3.8B参数，显著降低计算开销。
DiffusionGemma支持256K Token长上下文和多模态输入，适用于文本内联编辑、代码补全等任务。
尽管标准版Gemma 4在生成质量上更优，DiffusionGemma展示了新的发展方向。
HyperAI已上线易于部署的Notebook，便于开发者体验DiffusionGemma的强大能力。

🔎

延伸解读

生成速度的优势

DiffusionGemma的生成速度可达1100 Token/s，较传统模型提升了最高4倍。这一速度优势使其在需要快速生成文本的应用场景中，尤其是实时交互和代码补全等任务中，具有显著的竞争力。开发者可以利用这一特性，提升用户体验和工作效率。

计算效率与参数设计

DiffusionGemma采用26B参数的混合专家设计，推理时仅激活3.8B参数，这种设计显著降低了计算开销。对于资源有限的开发者而言，这意味着可以在较低的硬件要求下，依然实现高效的文本生成，降低了技术门槛。

多模态输入的应用潜力

该模型支持256K Token长上下文和多模态输入，适用于更复杂的任务，如图文结合的内容生成。这为开发者提供了新的可能性，可以探索更丰富的应用场景，尤其是在教育、创作和数据分析等领域。

❓

延伸问答

DiffusionGemma的生成速度有多快？

DiffusionGemma的生成速度最高可达1100 Token/s，生成速度提升最高可达4倍。

DiffusionGemma采用了什么样的模型架构？

DiffusionGemma采用26B参数的混合专家设计，推理过程中仅激活3.8B参数。

DiffusionGemma支持哪些类型的输入？

DiffusionGemma支持256K Token长上下文和多模态图文输入。

DiffusionGemma与标准版Gemma 4相比有什么不同？

尽管标准版Gemma 4在生成质量上更优，DiffusionGemma展示了新的发展方向。

如何体验DiffusionGemma的功能？

开发者可以通过HyperAI提供的易于部署的Notebook来体验DiffusionGemma的功能。

DiffusionGemma适合哪些任务？

DiffusionGemma适用于文本内联编辑、代码补全和数学结构生成等任务。

🏷️