HiPA: 通过高频率推广适应实现一步式文本到图像扩散模型

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

高频率促进适应(HiPA)是一种参数高效的方法,通过训练一步、低秩适配器来增强先进扩散模型中高频率能力的不足,使其能够在单一步骤中生成高质量图像。与渐进蒸馏相比,HiPA 在一步文本到图像生成中具有更好的性能(FID-5k 在 MS-COCO 2017 上从 37.3 降至 23.8),并具有 28.6 倍的训练加速(108.8 到 3.8 A100 GPU 天),仅需要 0.04%的训练参数(77.4 亿降至 330 万)。

🎯

关键要点

  • 高频率促进适应(HiPA)是一种参数高效的方法。
  • HiPA 通过训练一步、低秩适配器来增强先进扩散模型的高频率能力。
  • HiPA 能够在单一步骤中生成高质量图像。
  • 与渐进蒸馏相比,HiPA 在一步文本到图像生成中表现更好,FID-5k 从 37.3 降至 23.8。
  • HiPA 提供 28.6 倍的训练加速,从 108.8 A100 GPU 天降至 3.8 天。
  • HiPA 仅需要 0.04% 的训练参数,从 77.4 亿降至 330 万。
➡️

继续阅读