京东科技开发者 ·

京东正式开源JoyAI-Image-Edit：AI图像编辑从“平面修图“迈向“空间重塑“

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑，具备像素级精细化编辑和空间感知能力，广泛应用于电商、具身智能和3D重建等领域，提升创意验证效率。

🎯

🔎

JoyAI-Image-Edit模型的开源标志着图像编辑技术的重大进步，尤其是在空间理解与生成的结合上。传统模型在处理空间关系时常常出现失真，而该模型通过深度融合理解与生成能力，解决了这一问题。这种突破不仅提升了编辑的准确性，也为未来的多模态应用奠定了基础。

在电商行业，JoyAI-Image-Edit能够显著降低产品展示的成本和时间。商家只需一张主图，即可生成多角度展示图，避免了传统拍摄的高成本和长周期。这一技术的应用将推动电商行业的数字化转型，提高消费者的购物体验。

JoyAI-Image-Edit在具身智能领域的应用潜力巨大。通过合成空间一致的多视角训练样本，模型为机器人在导航和抓取等任务中提供了必要的空间推理能力。这一能力的提升将有助于推动智能机器人技术的发展，尤其是在复杂环境中的应用。

❓

JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑，具备像素级精细化编辑和空间感知能力。

该模型通过全链路注入空间感知，使理解、生成与编辑在统一框架内彼此增强，解决了空间层面的推理问题。

商家只需一张商品主图即可自动生成不同角度的展示图，降低了成本和周期。

支持视角变换、空间漫游和物体空间关系操控等操作，确保场景几何一致性。

用户仅需输入三张图片即可生成几何一致的多视角图像序列，拓展了电商三维展示等应用场景。

开源将推动开发者探索空间智能的更多可能，提升创意验证效率。

🏷️