小红花·文摘

本研究首次探讨了一步文本到图像生成模型与人类偏好的对齐问题。提出的新方法Diff-Instruct++通过强化学习和人类反馈，展示了在生成图像美学评分和多个指标上超越其他模型的潜力，具有重要的研究意义。