机器之心 ·

南洋理工&普渡大学提出CFG-Zero*：在Flow Matching模型中实现更稳健的无分类器引导方法

💡 原文中文，约4000字，阅读约需10分钟。

📝

内容提要

南洋理工大学与普渡大学提出了无分类引导新方法CFG-Zero*，改进了Flow Matching模型的生成效果。该方法通过优化缩放因子和零初始化，提升了图像和视频生成的细节保真度与文本对齐性，已集成至Diffusers和ComfyUI，适用于多种生成任务。

🎯

🔎

CFG-Zero*通过优化缩放因子和零初始化两项创新机制，显著提升了生成模型的效果。优化缩放因子动态调整无条件项的强度，避免过度引导带来的误差，而零初始化则有效降低了初始阶段的误差传播。这些改进使得生成的图像和视频在细节和文本对齐性上表现更佳。

Flow Matching模型逐渐取代传统的扩散方法，因其更高的可解释性和收敛速度。CFG-Zero*的提出进一步增强了Flow Matching的生成能力，使其在图像和视频生成任务中表现出色，尤其是在需要精准表达复杂语义的场景中。

CFG-Zero*已被快速集成至Diffusers和ComfyUI等开源平台，普通开发者和创作者可以轻松使用这一新方法。这种快速落地的能力不仅提升了生成效果，也为更多人提供了探索生成式AI的机会，推动了相关技术的普及与应用。

❓

CFG-Zero*主要通过优化缩放因子和零初始化两项创新机制，提升生成效果。

CFG-Zero*通过动态计算有条件与无条件速度的内积比值，避免过度引导导致的误差，从而提升细节保真度和文本对齐性。

CFG-Zero*在模型训练不足时能有效降低初始误差传播，避免样本偏离真实分布，而传统CFG在此情况下容易引入伪影。

CFG-Zero*适用于文本生成图像和文本生成视频等多种生成任务。

CFG-Zero*在多个任务与主流模型上进行了验证，特别是在图像生成和视频生成任务中表现优异。

CFG-Zero*已集成至Diffusers和ComfyUI，普通开发者与创作者可以通过这些平台轻松体验其提升效果。

🏷️