Apple Machine Learning Research ·

用于分类生成建模的连续增强离散扩散模型

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

本文介绍了连续增强离散扩散模型（CADD），该模型通过在连续潜在空间中增强离散状态空间，解决了传统离散扩散模型的信息缺失问题。CADD利用噪声潜在向量表示被遮蔽的标记，提升了文本生成、图像合成和代码建模的生成质量，并在多样性与上下文精确性之间实现了灵活控制。

🎯

🔎

传统的离散扩散模型通过将未观察状态映射到[MASK]标记，导致了信息缺失。这种方法无法有效利用未遮蔽标记所包含的语义信息，从而影响生成质量。CADD模型通过引入连续潜在空间，解决了这一问题，避免了信息空洞的产生。

CADD模型在文本生成、图像合成和代码建模等领域表现出色，提升了生成质量。通过使用噪声潜在向量表示被遮蔽的标记，CADD能够在多样性与上下文精确性之间实现灵活控制，为生成任务提供了更高的灵活性和准确性。

CADD模型的设计兼容现有的离散扩散训练，且在采样时可以根据需要调整连续潜在向量的强度和选择。这种灵活性使得模型能够在生成多样化输出和生成上下文精确输出之间进行有效权衡，适用于多种生成任务。

❓

CADD是一种通过在连续潜在空间中增强离散状态空间来解决传统离散扩散模型信息缺失问题的框架。

CADD通过使用噪声潜在向量表示被遮蔽的标记，避免了信息空洞的产生，从而解决了信息缺失问题。

CADD在文本生成、图像合成和代码建模中提升了生成质量，并在多样性与上下文精确性之间实现了灵活控制。

在采样时，CADD通过选择连续潜在向量的估计器的强度和选择，控制生成的多样性和上下文精确性。

CADD增强了离散状态空间，避免了将所有未观察状态映射到吸收的[MASK]标记，从而减少了信息损失。

CADD在文本生成、图像合成和代码建模中表现出一致的质量提升，超越了基于掩码的扩散模型。

🏷️