实时互动网 ·

Google AI 发布 DiffusionGemma：基于文本扩散的 260 亿 MoE 开放模型，生成速度可提升 4 倍

💡 原文中文，约3100字，阅读约需8分钟。

📝

内容提要

谷歌AI团队发布了DiffusionGemma，一个260亿参数的开源文本生成模型。该模型采用文本扩散技术，支持并行生成，速度比传统自回归模型快4倍，适用于在线编辑、快速迭代和长文档分析等场景。尽管生成速度快，但输出质量低于标准Gemma 4，谷歌建议在生产中使用后者。

🎯

🔎

DiffusionGemma 适用于需要快速生成和迭代的场景，如在线编辑和长文档分析。其并行生成能力使其在处理非线性文本结构时表现优异，尤其适合开发者进行交互式工作。

尽管 DiffusionGemma 在生成速度上有显著提升，但其输出质量低于标准的 Gemma 4。用户在选择模型时需考虑应用场景，若对质量要求较高，仍应优先使用 Gemma 4。

DiffusionGemma 采用双向注意力机制和并行处理，显著提高了计算效率。这种架构设计使得模型在处理大规模输入时，能够更好地利用 GPU 资源，减少内存带宽的瓶颈。

❓

DiffusionGemma 是一个260亿参数的开源文本生成模型，采用文本扩散技术，支持并行生成。

DiffusionGemma 的生成速度比传统自回归模型快4倍，适合高速度要求的应用场景。

DiffusionGemma 适用于在线编辑、快速迭代、长文档分析、OCR 和文档解析等场景。

尽管生成速度快，但DiffusionGemma的输出质量低于标准的Gemma 4，谷歌建议在生产中使用后者。

DiffusionGemma 通过并行处理256个token的画布，使用双向注意力机制实现实时自我纠正。

量化后的DiffusionGemma占用显存仅为18GB，适合高端消费级GPU使用。

🏷️