机器之心 ·

逐字生成非最优？试试逐「块」生成！Block Diffusion打通了自回归与扩散

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

OpenAI 的块离散去噪扩散语言模型（BD3-LMs）结合了扩散与自回归模型，解决了生成任意长度序列的局限性。研究表明，BD3-LMs 在多个基准测试中表现出最佳困惑度，能够高效生成可变长度文档，克服了传统扩散模型的缺陷。

🎯

🔎

BD3-LMs 通过结合扩散与自回归模型，克服了传统扩散模型在生成固定长度序列上的局限性。这种创新使得模型能够生成任意长度的文档，适应性更强，尤其在需要灵活响应的应用场景中表现优越。

研究者在开发 BD3-LMs 时面临高方差训练和计算效率的问题。为了解决这些挑战，他们提出了自定义噪声过程和高效的训练算法，这不仅提高了生成质量，也减少了生成步骤，提升了整体效率。

BD3-LMs 在多个基准测试中展现出最佳的困惑度，表明其生成的文本质量显著优于传统方法。这一进展为文本生成领域带来了新的可能性，尤其是在需要高质量输出的应用中，BD3-LMs 可能成为更优选择。

❓

BD3-LMs模型结合了扩散与自回归模型，能够高效生成可变长度文档，克服了传统扩散模型的固定长度限制。

BD3-LMs通过块离散去噪扩散模型，允许生成任意长度的序列，并优化了训练和采样算法，减少了生成步骤。

BD3-LMs在多个语言建模基准上表现出最佳困惑度，能够生成超出训练上下文的任意长度序列。

研究者面临的挑战包括计算块扩散模型的训练目标和高方差的扩散目标梯度，这影响了模型的训练效果。

BD3-LMs通过自定义噪声过程来最小化梯度方差，并在训练期间自适应学习噪声调度，以提高模型的性能。

BD3-LMs结合了自回归和扩散模型的优点，提供了更好的似然估计和灵活的长度生成，而传统自回归模型通常只能生成固定长度的输出。

🏷️