京东科技开发者 ·

京东正式开源JoyAI-Image-Edit：AI图像编辑从“平面修图“迈向“空间重塑“

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑，具备像素级精细化编辑和空间感知能力，适用于电商、具身智能和3D重建等领域，显著提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

🎯

🔎

JoyAI-Image-Edit模型的开源标志着图像编辑技术的一次重大进步。通过将空间理解与生成深度融合，该模型能够在空间层面进行推理，解决了传统模型在物体移动和视角切换时的结构失真问题。这种突破为未来的图像编辑应用提供了更高的灵活性和一致性，尤其在电商和3D重建领域具有重要意义。

JoyAI-Image-Edit的多模态能力使其在多个行业中展现出广泛的应用潜力。在电商领域，商家可以通过该模型快速生成多角度展示图，降低成本和时间。在具身智能和3D重建领域，模型的空间理解能力为机器人导航和视觉系统提供了基础支持，推动了相关技术的发展。

随着JoyAI-Image-Edit的开源，开发者们可以利用这一先进模型探索新的应用场景。无论是在创意设计、游戏开发还是文化遗产保护等领域，开发者都能借助其强大的空间编辑能力，提升工作效率和创意验证的速度。这为技术创新和行业发展提供了新的动力。

❓

JoyAI-Image-Edit模型支持文生图、图像理解和指令引导的图像编辑，具备像素级精细化编辑和空间感知能力。

该模型允许商家通过一张商品主图自动生成不同角度的展示图，显著降低了成本和时间。

模型支持视角变换、空间漫游和物体空间关系操控等三类空间编辑操作，提升了编辑的灵活性和一致性。

开发者可以在HuggingFace或Github上获取JoyAI-Image-Edit模型。

该模型采用MLLM–MMDiT统一架构，深度融合生成与理解，打破了二者的边界。

用户仅需输入三张图片即可生成几何一致的多视角图像序列，适用于电商三维展示、品牌VI生成等场景。

🏷️