DiffExp: Efficient Exploration in Reward Fine-tuning for Text-to-Image Diffusion Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出DiffExp策略,解决文本到图像扩散模型在奖励微调中因在线样本生成导致的慢收敛问题。通过动态调整引导规模和随机加权文本提示,显著提升样本生成效率和多样性,从而提高模型性能。
🎯
关键要点
- 本研究提出DiffExp策略,旨在解决文本到图像扩散模型在奖励微调中因在线样本生成导致的慢收敛问题。
- DiffExp通过动态调整无分类器引导的规模,显著提升样本生成的效率和多样性。
- 随机加权文本提示短语的使用进一步提高了模型的整体性能。
➡️