本研究首次探讨了一步文本到图像生成模型与人类偏好的对齐问题。提出的新方法Diff-Instruct++通过强化学习和人类反馈,展示了在生成图像美学评分和多个指标上超越其他模型的潜力,具有重要的研究意义。
完成下面两步后,将自动完成登录并继续当前操作。