360AI推出DiT架构下”省钱版”ControlNet, 参数量骤减85%性能达到SOTA!

💡 原文中文,约3200字,阅读约需8分钟。
📝

内容提要

360AI推出了新一代高效可控生成框架RelaCtrl,参数量减少85%,性能超越OminiControl。该框架优化了Diffusion Transformer的控制信号集成,提升了计算资源分配效率,实验结果显示生成质量和控制精度均表现优异。

🎯

关键要点

  • 360AI推出新一代高效可控生成框架RelaCtrl,参数量减少85%,性能超越OminiControl。
  • RelaCtrl优化了Diffusion Transformer的控制信号集成,提升计算资源分配效率。
  • 现有可控Diffusion Transformer方法存在参数和计算开销大、控制信息相关性忽视的问题。
  • 研究团队提出基于相关性引导的高效可控生成框架,通过精确参数分配和控制策略减少模型参数。
  • RelaCtrl选择11个关键控制位置用于集成控制模块,实现与PixArt-δ相当的控制性能。
  • 引入相关性引导轻量级控制块(RGLC),简化架构并提高效率。
  • 提出二维shuffle混合器(TDSM),增强token组之间的交互和建模能力。
  • 实验结果表明RelaCtrl在视觉效果、控制指标和文本相似度上均优于对比方法。
  • RelaCtrl在参数和计算复杂度上显著低于ControlNet,表现出更高的效率。
  • RelaCtrl兼容通过Lora微调的PixArt权重,能够有效利用社区模型。
➡️

继续阅读