文章讨论了具身智能的概念,通过组装小机器狗的过程,探讨了传感器、舵机控制和云端AI对话的实现。作者强调了AI与物理世界结合的复杂性,涉及感知、空间和动作等基本概念。小机器狗能执行简单指令,但缺乏空间感知能力,未来需整合更多传感器和算法以提升智能水平。
蔚蓝科技推出的BabyAlpha A3消费级四足机器人,具备6600万像素视觉和223.2万点/秒的空间感知能力,标志着机器人向理解环境的转变。A3采用六颗芯片的异构计算集群,提升算力效率,预计售价万元级,旨在进入普通家庭。其安全设计和本地数据处理增强了用户信任,推动消费级具身智能的发展。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著降低成本和提升效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在生成与理解的深度融合、空间编辑的范式突破和多场景高性能表现方面具有技术优势,广泛应用于电商、具身智能和3D重建等领域,提升创意验证效率。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著提升创意验证效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,广泛应用于电商、具身智能和3D重建等领域,提升创意验证效率。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在电商、具身智能和3D重建等领域表现出色,显著提升创意验证效率。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著提升创意验证效率。开发者可在HuggingFace或Github获取该模型。
京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在电商、具身智能和3D重建等领域表现出色,提升了创意验证效率。
GigaBrain-0是一种新型视觉-语言-动作(VLA)模型,旨在通过整合视觉输入、自然语言指令和运动控制,提升机器人在多样环境中的操作能力。该模型利用生成的数据,降低对真实世界数据的依赖,提高泛化能力和数据效率。GigaBrain-0采用混合架构,增强空间感知能力,并通过生成中间推理步骤,模拟人类问题解决过程,实现更精确的操作和决策。
蚂蚁灵波科技开源了具身大模型LingBot-VLA,提升了机器人在真实场景中的操作能力。该模型实现了跨本体和跨任务的泛化,降低了训练成本,并在多项评测中刷新成功率纪录。LingBot-VLA结合高精度空间感知模型,增强了深度信息处理能力,助力开发者快速适应不同场景,推动具身智能的发展。
寒武纪项目由谢赛宁、李飞飞和LeCun主导,推出了Cambrian-S模型,专注于提升AI的空间感知能力。该模型通过多模态视频理解,解决了传统模型在长视频处理中的不足,取得了显著进展。
Evo-0模型通过隐式注入3D几何先验,提升机器人对三维空间的理解,成功率提高31%。该方法无需额外传感器,利用VGGT提取3D信息,显著增强空间感知,训练效率高,适用于多种机器人任务。
群核科技发布了InteriorGS数据集,包含1000个3D场景,旨在提升机器人空间感知能力。该数据集结合3D高斯技术与空间大模型,助力AI从虚拟环境走向物理世界。
本研究提出了3DTown框架,旨在从单张俯视图生成逼真的三维城镇,解决传统3D场景获取的高成本和低效率问题。该方法通过区域生成和空间感知技术,确保场景一致性和几何质量,实验结果显示其优于现有技术。
本文提出了一种新的评估方法——代理忠实度(SF),解决了现有解释方法忠实度评估不足的问题。研究表明,引入空间感知显著提高了解释的忠实度,最佳忠实度(OF)在多种情况下提供更准确的解释,并在处理不同领域的数据和对抗样本时表现出更好的鲁棒性。
完成下面两步后,将自动完成登录并继续当前操作。