小红花·文摘

本文介绍了通过增强学习优化扩散模型的方法，包括去噪扩散策略优化（DDPO）和DPOK，旨在提升图像质量和文本对齐。此外，研究提出了AlignProp方法，利用人类反馈改进文本转语音合成，增强模型的多样性和公平性。这些方法使扩散模型在多个视觉任务上取得了显著进展。