鸸鹋编辑:通过识别和生成任务进行精确图像编辑
原文中文,约500字,阅读约需2分钟。发表于: 。Emu Edit 是一个多任务图像编辑模型,通过训练在广泛的任务上展示出卓越的性能,引入了学习任务嵌入来指导生成过程,使其能够成功执行用户的自然语言指令,并且能够推广到新的任务,并发布了一个多样化的基准模型进行评估。
本文介绍了一种通过质量微调方法来提高预训练文本到图像模型生成高质量图像的技术。研究者使用少量具有视觉吸引力的图像进行有监督的微调,提高了生成质量。实验结果显示,经过微调的模型在美学上的胜率为82.9%,在基准测试中也表现出较高的优先选择概率。质量微调方法在其他架构中同样有效。