Gitee 官方博客 ·

GLM-Image 上线模力方舟：首个国产芯片训练的多模态图像生成模型

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

智谱AI与华为联合研发的GLM-Image多模态图像生成模型已开源，打破了海外模型的垄断。该模型在国产芯片上完成全流程训练，支持文本生成图像、图像编辑和风格迁移，具备高质量的视觉理解能力。

🎯

🔎

GLM-Image 是首个在国产芯片上完成全流程训练的多模态模型，标志着中国在 AI 领域的自主可控能力提升。这一进展不仅减少了对海外技术的依赖，也为未来的国产 AI 生态奠定了基础，推动了相关产业的发展。

GLM-Image 支持文本生成图像、图像编辑和风格迁移等多种功能，适用于广告、艺术创作等多个领域。这种多样化的应用能力使其在市场上具备竞争优势，开发者可以利用这些功能进行创新，满足不同用户需求。

GLM-Image 通过 Glyph-byT5 字符编码模型和 OCR 优化，显著提高了中文文本的还原率。这一技术突破解决了以往生成中文字时常见的错别字和乱码问题，为中文用户提供了更好的使用体验，增强了模型的实用性。

❓

GLM-Image支持文本生成图像、图像编辑、风格迁移和多图一致性生成。

GLM-Image是首个在国产芯片上完成全流程训练的多模态模型，标志着国产AI生态的自主可控。

GLM-Image全程运行在华为昇腾芯片与昇思MindSpore框架上，采用自回归与扩散解码混合架构。

GLM-Image通过Glyph-byT5字符编码模型和OCR优化，实现了较高的中文文本还原率。

开发者可以通过模力方舟平台在线体验GLM-Image模型，支持API调用。

GLM-Image采用自回归与扩散解码的混合架构，提升了语义理解和细节表现能力。

🏷️