Apple Machine Learning Research ·

UniGen-1.5：通过强化学习中的奖励统一增强图像生成与编辑

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

UniGen-1.5是一种多模态大语言模型，增强了图像理解、生成和编辑能力。通过共享奖励模型的强化学习策略，UniGen-1.5在图像生成和编辑方面表现优异，实验结果显示其在GenEval和ImgEdit上的得分超过现有最先进模型，性能与专有模型相当。

🎯

🔎

UniGen-1.5通过共享奖励模型的强化学习策略，成功实现了图像生成与编辑的协同提升。这种创新的学习方式不仅提高了模型的整体性能，还为未来的多模态模型开发提供了新的思路，尤其是在处理复杂任务时的有效性。

UniGen-1.5引入的轻量级编辑指令对齐阶段，显著提升了模型对编辑指令的理解能力。这一改进对于强化学习训练的成功至关重要，表明在设计多模态模型时，细致的指令处理能力不可忽视。

实验结果显示，UniGen-1.5在GenEval和ImgEdit上的得分超越了现有最先进模型，且与专有模型的性能相当。这表明，UniGen-1.5不仅在技术上具有竞争力，也为开源社区提供了强有力的替代方案，值得关注其后续发展。

❓

UniGen-1.5是一种多模态大语言模型，专注于图像理解、生成和编辑。

通过改进架构和训练流程，UniGen-1.5增强了图像理解和生成能力，并引入了统一的强化学习策略。

UniGen-1.5在GenEval和ImgEdit上的得分分别为0.89和4.31，超越了现有最先进模型。

统一的强化学习策略通过共享奖励模型共同改善图像生成和编辑。

该阶段显著提高了编辑指令的理解能力，对强化学习训练的成功至关重要。

UniGen-1.5的性能与专有模型相当，且在多个评估指标上超越了现有最先进模型。

🏷️