京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著降低成本和提升效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在生成与理解的深度融合、空间编辑的范式突破和多场景高性能表现方面具有技术优势,广泛应用于电商、具身智能和3D重建等领域,提升创意验证效率。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著提升创意验证效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,广泛应用于电商、具身智能和3D重建等领域,提升创意验证效率。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在电商、具身智能和3D重建等领域表现出色,显著提升创意验证效率。
GigaBrain-0是一种新型视觉-语言-动作(VLA)模型,旨在通过整合视觉输入、自然语言指令和运动控制,提升机器人在多样环境中的操作能力。该模型利用生成的数据,降低对真实世界数据的依赖,提高泛化能力和数据效率。GigaBrain-0采用混合架构,增强空间感知能力,并通过生成中间推理步骤,模拟人类问题解决过程,实现更精确的操作和决策。
蚂蚁灵波科技开源了具身大模型LingBot-VLA,提升了机器人在真实场景中的操作能力。该模型实现了跨本体和跨任务的泛化,降低了训练成本,并在多项评测中刷新成功率纪录。LingBot-VLA结合高精度空间感知模型,增强了深度信息处理能力,助力开发者快速适应不同场景,推动具身智能的发展。
寒武纪项目由谢赛宁、李飞飞和LeCun主导,推出了Cambrian-S模型,专注于提升AI的空间感知能力。该模型通过多模态视频理解,解决了传统模型在长视频处理中的不足,取得了显著进展。
Evo-0模型通过隐式注入3D几何先验,提升机器人对三维空间的理解,成功率提高31%。该方法无需额外传感器,利用VGGT提取3D信息,显著增强空间感知,训练效率高,适用于多种机器人任务。
群核科技发布了InteriorGS数据集,包含1000个3D场景,旨在提升机器人空间感知能力。该数据集结合3D高斯技术与空间大模型,助力AI从虚拟环境走向物理世界。
本研究提出了3DTown框架,旨在从单张俯视图生成逼真的三维城镇,解决传统3D场景获取的高成本和低效率问题。该方法通过区域生成和空间感知技术,确保场景一致性和几何质量,实验结果显示其优于现有技术。
本文提出了一种新的评估方法——代理忠实度(SF),解决了现有解释方法忠实度评估不足的问题。研究表明,引入空间感知显著提高了解释的忠实度,最佳忠实度(OF)在多种情况下提供更准确的解释,并在处理不同领域的数据和对抗样本时表现出更好的鲁棒性。
本研究提出了一种基于视频的空间感知框架,解决了机器人控制中不同摄像头观察的稳健泛化问题,通过图像增强技术和单目深度估计模型,提高了动态场景中的成功率。
介绍了一种新型的空间感知的3D形状生成框架,利用2D平面表示增强3D形状建模,通过学习三维形状的连续有符号距离场表示确保空间一致性和减少内存使用。通过基于Transformer的自编码结构实施不同平面之间的空间对应关系,促进生成的3D形状中空间关系的保留。在无条件形状生成、多模态形状补全、单视图重建和文本到形状合成等任务上表现优于最先进的3D形状生成方法。
该论文介绍了一种名为SATOP的新型空间感知深度强化学习方法,通过学习停车位、代理和动作之间的空间关系,以及未来动作之间的相互关系,实现在提高罚款的同时动态调整到当前可罚款的停车违规情况,并计划提高官员在违规发生时到达的可能性。结果显示,SATOP在停车违规方面表现优于现有方法,能罚款多达22%的停车违规。
完成下面两步后,将自动完成登录并继续当前操作。