UniGen是一种统一的多模态大语言模型,具备图像理解和生成能力。通过多阶段预训练和监督微调,UniGen引入了链式思维验证(CoT-V)策略,显著提升了图像生成质量。在多个基准测试中,UniGen表现优异,最终得分为0.78(GenEval)和85.19(DPG-Bench),为未来研究指明了方向。
完成下面两步后,将自动完成登录并继续当前操作。