量子位 ·

360AI推出DiT架构下”省钱版”ControlNet, 参数量骤减85%性能达到SOTA！

💡 原文中文，约3200字，阅读约需8分钟。

📝

内容提要

360AI推出了新一代高效可控生成框架RelaCtrl，参数量减少85%，性能超越OminiControl。该框架优化了Diffusion Transformer的控制信号集成，提升了计算资源分配效率，实验结果显示生成质量和控制精度均表现优异。

🎯

🔎

RelaCtrl通过引入相关性引导轻量级控制块（RGLC）和二维shuffle混合器（TDSM），有效简化了Diffusion Transformer的架构。这种设计不仅减少了模型参数，还提升了计算效率，解决了传统方法中控制信息相关性忽视的问题。

实验表明，RelaCtrl在视觉效果、控制指标和文本相似度上均优于现有方法。这一结果不仅验证了其在生成质量上的优势，也为未来的可控生成研究提供了新的思路，尤其是在资源受限的环境中。

RelaCtrl能够兼容通过Lora微调的PixArt权重，这意味着它可以有效利用现有的社区模型。这种兼容性为开发者提供了更大的灵活性，能够在不同的应用场景中实现高效的可控生成。

❓

RelaCtrl框架的主要优势在于参数量减少85%，性能超越OminiControl，同时优化了Diffusion Transformer的控制信号集成，提升了计算资源分配效率。

RelaCtrl通过精确的参数分配和控制策略，结合轻量化设计的控制模块，优化了Diffusion Transformer中的控制信号集成。

实验结果表明，RelaCtrl在视觉效果、控制指标和文本相似度上均优于对比方法，表现出更高的生成质量和控制精度。

RelaCtrl通过引入相关性引导的高效可控生成框架，解决了参数和计算开销大、控制信息相关性忽视的问题。

RelaCtrl在参数和计算复杂度上显著低于ControlNet，表现出更高的效率，参数增加仅为7.38%，计算复杂度增加8.61%。

是的，RelaCtrl可以有效利用通过Lora微调的PixArt权重，展示出良好的兼容能力。

🏷️