小红花·文摘

本研究提出了一种自我提升框架SILMM，旨在解决大型多模态模型在文本到图像生成中的对齐准确性问题。通过直接偏好优化，SILMM实现了模型的自我反馈与优化，实验结果表明其性能提升超过30%。