机器之心 ·

扩散模型=流匹配？谷歌DeepMind博客深度详解这种惊人的等价性

💡 原文中文，约5800字，阅读约需14分钟。

📝

内容提要

扩散模型与流匹配本质上等价，尽管实现方式不同。扩散模型通过去噪声逐步恢复数据，而流匹配通过可逆变换映射分布。研究表明，两者可灵活结合，利用不同采样策略提升生成效果。

🎯

🔎

扩散模型和流匹配的等价性为研究者提供了灵活的工具组合。通过结合这两种方法，研究者可以在训练流匹配模型后，采用随机采样策略，提升生成效果。这种灵活性使得在不同应用场景中，能够根据具体需求选择最优的采样策略。

尽管训练噪声调度对训练目标的重要性较小，但它仍然会影响训练效率。选择合适的噪声调度参数（如λ_max和λ_min）可以帮助模型更好地接近干净数据和高斯噪声，从而提高生成样本的质量。

加权函数在训练过程中至关重要，它平衡了不同频率分量的重要性。流匹配中的加权方法与扩散模型中的常用方法相似，这意味着在选择加权函数时，可以借鉴已有的成功经验，以提高模型的生成效果。

❓

扩散模型和流匹配本质上是等价的，尽管实现方式不同，前者通过去噪声逐步恢复数据，后者通过可逆变换映射分布。

扩散模型的前向过程涉及将带噪声数据与原始数据之间的关系，通过添加随机噪声逐步破坏数据。

流匹配的采样方式是确定性的，通常表现为直线路径，而扩散模型的采样方式是随机性的，表现为曲线路径。

可以在训练流匹配模型后，引入随机采样策略，而不是局限于传统的确定性采样方法，从而灵活结合两者。

训练噪声调度对训练目标的重要性较小，但会影响训练效率，选择合适的噪声调度可以优化训练过程。

加权函数在训练中平衡了不同频率分量的重要性，流匹配的加权与扩散模型中的常用加权方法相似。

🏷️