小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著降低成本和提升效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在生成与理解的深度融合、空间编辑的范式突破和多场景高性能表现方面具有技术优势,广泛应用于电商、具身智能和3D重建等领域,提升创意验证效率。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,广泛应用于电商、具身智能和3D重建等领域,提升创意验证效率。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在电商、具身智能和3D重建等领域表现出色,显著提升创意验证效率。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力

GigaBrain-0是一种新型视觉-语言-动作(VLA)模型,旨在通过整合视觉输入、自然语言指令和运动控制,提升机器人在多样环境中的操作能力。该模型利用生成的数据,降低对真实世界数据的依赖,提高泛化能力和数据效率。GigaBrain-0采用混合架构,增强空间感知能力,并通过生成中间推理步骤,模拟人类问题解决过程,实现更精确的操作和决策。

GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力

结构之法 算法之道
结构之法 算法之道 · 2026-02-14T12:16:31Z

蚂蚁灵波科技开源了具身大模型LingBot-VLA,提升了机器人在真实场景中的操作能力。该模型实现了跨本体和跨任务的泛化,降低了训练成本,并在多项评测中刷新成功率纪录。LingBot-VLA结合高精度空间感知模型,增强了深度信息处理能力,助力开发者快速适应不同场景,推动具身智能的发展。

蚂蚁灵波开源具身大模型LingBot-VLA,让机器人“看的更清楚 做的更明白”

量子位
量子位 · 2026-01-28T02:21:46Z

寒武纪项目由谢赛宁、李飞飞和LeCun主导,推出了Cambrian-S模型,专注于提升AI的空间感知能力。该模型通过多模态视频理解,解决了传统模型在长视频处理中的不足,取得了显著进展。

谢赛宁李飞飞LeCun搞的寒武纪,究竟是个啥?

量子位
量子位 · 2025-11-24T06:29:42Z

Evo-0模型通过隐式注入3D几何先验,提升机器人对三维空间的理解,成功率提高31%。该方法无需额外传感器,利用VGGT提取3D信息,显著增强空间感知,训练效率高,适用于多种机器人任务。

机器人感知大升级!轻量化注入几何先验,成功率提升31%

量子位
量子位 · 2025-09-29T06:15:49Z

群核科技发布了InteriorGS数据集,包含1000个3D场景,旨在提升机器人空间感知能力。该数据集结合3D高斯技术与空间大模型,助力AI从虚拟环境走向物理世界。

群核科技发布3D高斯语义数据集,给机器人装上“空间大脑”

量子位
量子位 · 2025-07-25T08:32:20Z

本研究提出了3DTown框架,旨在从单张俯视图生成逼真的三维城镇,解决传统3D场景获取的高成本和低效率问题。该方法通过区域生成和空间感知技术,确保场景一致性和几何质量,实验结果显示其优于现有技术。

Constructing a 3D Town from a Single Image

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本文提出了一种新的评估方法——代理忠实度(SF),解决了现有解释方法忠实度评估不足的问题。研究表明,引入空间感知显著提高了解释的忠实度,最佳忠实度(OF)在多种情况下提供更准确的解释,并在处理不同领域的数据和对抗样本时表现出更好的鲁棒性。

面向空间感知和最佳忠实度的基于概念的解释

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

本研究提出了一种基于视频的空间感知框架,解决了机器人控制中不同摄像头观察的稳健泛化问题,通过图像增强技术和单目深度估计模型,提高了动态场景中的成功率。

End-to-End Robot Learning Based on Spatial Visual Perception

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

介绍了一种新型的空间感知的3D形状生成框架,利用2D平面表示增强3D形状建模,通过学习三维形状的连续有符号距离场表示确保空间一致性和减少内存使用。通过基于Transformer的自编码结构实施不同平面之间的空间对应关系,促进生成的3D形状中空间关系的保留。在无条件形状生成、多模态形状补全、单视图重建和文本到形状合成等任务上表现优于最先进的3D形状生成方法。

NeuSDFusion:一种面向空间感知的生成模型用于 3D 形状补全、重构和生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-27T00:00:00Z

该论文介绍了一种名为SATOP的新型空间感知深度强化学习方法,通过学习停车位、代理和动作之间的空间关系,以及未来动作之间的相互关系,实现在提高罚款的同时动态调整到当前可罚款的停车违规情况,并计划提高官员在违规发生时到达的可能性。结果显示,SATOP在停车违规方面表现优于现有方法,能罚款多达22%的停车违规。

空间感知深度强化学习与巡逻官员问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码