OpenLEAF是一种交错生成框架,用于生成高质量的图像-文本内容。该框架通过多模态模型评估实体和风格的一致性,可应用于各种领域和任务。人类评估验证了该评估技术的有效性。
上海交通大学的生成式人工智能研究实验室(GAIR)开发了全球首个完全开源、自回归、原生的多模态大模型Anole,能够实现交错图文生成。Anole通过微调Meta AI的Chameleon模型实现图像生成和理解能力,提供了全面的微调和推理代码以及丰富的资源。GAIR团队已将Anole项目完全开源,推动了多模态AI的发展。
完成下面两步后,将自动完成登录并继续当前操作。