ERNIE-Image是一个开源的文生图模型,基于8B参数的DiT架构,适用于多种视觉风格,特别适合海报和漫画内容的生产。它提供标准和极速两种模型,支持新手用户通过ComfyUI进行部署和使用,用户可轻松生成高质量图像。
腾讯混元图像3.0在全球文生图模型中排名第一,超越谷歌Nano Banana等闭源模型。该模型采用多模态架构,具备强大的语义理解和生成能力,支持多种输入输出形式,展现出卓越的技术实力。
豆包大模型家族推出新版本深度思考模型,具备强大视觉理解和推理能力,支持多模态输入,提升用户体验。同时,豆包文生图模型升级至3.0版本,生成效果显著提升。火山引擎持续推动国产AI技术创新。
字节跳动发布了Seedream 2.0技术报告,介绍了其文生图模型的构建方法和技术细节。该模型支持中英双语图像生成,文本渲染能力强,尤其在国风内容生成方面表现突出。团队通过优化数据处理和训练阶段,提升了模型性能,解决了多项图像生成难题。
本文介绍了华为云的DreamBooth和LoRA技术。DreamBooth是一种生成个性化文生图模型的方法,用户可以微调文生图模型,生成包含特定主体的图片。LoRA是一种训练方法,可以在消耗较少内存的同时加速大模型的训练。本文提供了一键运行的notebook AI作画Dreambooth生成自定义主体和零代码运行的Workflow DreamBooth自定义生成主体两种形式的案例。
完成下面两步后,将自动完成登录并继续当前操作。