小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
你不知道的具身智能:从小机器狗到 Optimus

文章讨论了具身智能的概念,通过组装小机器狗的过程,探讨了传感器、舵机控制和云端AI对话的实现。作者强调了AI与物理世界结合的复杂性,涉及感知、空间和动作等基本概念。小机器狗能执行简单指令,但缺乏空间感知能力,未来需整合更多传感器和算法以提升智能水平。

你不知道的具身智能:从小机器狗到 Optimus

Tw93 的博客
Tw93 的博客 · 2026-06-07T00:00:00Z
一只机器狗,把英伟达的算力王座拱翻了

蔚蓝科技推出的BabyAlpha A3消费级四足机器人,具备6600万像素视觉和223.2万点/秒的空间感知能力,标志着机器人向理解环境的转变。A3采用六颗芯片的异构计算集群,提升算力效率,预计售价万元级,旨在进入普通家庭。其安全设计和本地数据处理增强了用户信任,推动消费级具身智能的发展。

一只机器狗,把英伟达的算力王座拱翻了

量子位
量子位 · 2026-05-17T15:10:59Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著降低成本和提升效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在生成与理解的深度融合、空间编辑的范式突破和多场景高性能表现方面具有技术优势,广泛应用于电商、具身智能和3D重建等领域,提升创意验证效率。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,广泛应用于电商、具身智能和3D重建等领域,提升创意验证效率。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在电商、具身智能和3D重建等领域表现出色,显著提升创意验证效率。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,显著提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,适用于电商、具身智能和3D重建等领域,提升创意验证效率。开发者可在HuggingFace或Github获取该模型。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东开源的多模态基础模型JoyAI-Image-Edit支持文生图、图像理解和指令引导的图像编辑,具备像素级精细化编辑和空间感知能力,解决了理解与生成之间的“空间断层”。该模型在电商、具身智能和3D重建等领域表现出色,提升了创意验证效率。

京东正式开源JoyAI-Image-Edit:AI图像编辑从“平面修图“迈向“空间重塑“

京东科技开发者
京东科技开发者 · 2026-04-08T02:45:34Z
GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力

GigaBrain-0是一种新型视觉-语言-动作(VLA)模型,旨在通过整合视觉输入、自然语言指令和运动控制,提升机器人在多样环境中的操作能力。该模型利用生成的数据,降低对真实世界数据的依赖,提高泛化能力和数据效率。GigaBrain-0采用混合架构,增强空间感知能力,并通过生成中间推理步骤,模拟人类问题解决过程,实现更精确的操作和决策。

GigaBrain-0——通过世界模型GigaWorld增强VLA的泛化能力:基于RGBD输入建模,及通过具身CoT增强推理能力

结构之法 算法之道
结构之法 算法之道 · 2026-02-14T12:16:31Z

蚂蚁灵波科技开源了具身大模型LingBot-VLA,提升了机器人在真实场景中的操作能力。该模型实现了跨本体和跨任务的泛化,降低了训练成本,并在多项评测中刷新成功率纪录。LingBot-VLA结合高精度空间感知模型,增强了深度信息处理能力,助力开发者快速适应不同场景,推动具身智能的发展。

蚂蚁灵波开源具身大模型LingBot-VLA,让机器人“看的更清楚 做的更明白”

量子位
量子位 · 2026-01-28T02:21:46Z

寒武纪项目由谢赛宁、李飞飞和LeCun主导,推出了Cambrian-S模型,专注于提升AI的空间感知能力。该模型通过多模态视频理解,解决了传统模型在长视频处理中的不足,取得了显著进展。

谢赛宁李飞飞LeCun搞的寒武纪,究竟是个啥?

量子位
量子位 · 2025-11-24T06:29:42Z

Evo-0模型通过隐式注入3D几何先验,提升机器人对三维空间的理解,成功率提高31%。该方法无需额外传感器,利用VGGT提取3D信息,显著增强空间感知,训练效率高,适用于多种机器人任务。

机器人感知大升级!轻量化注入几何先验,成功率提升31%

量子位
量子位 · 2025-09-29T06:15:49Z

群核科技发布了InteriorGS数据集,包含1000个3D场景,旨在提升机器人空间感知能力。该数据集结合3D高斯技术与空间大模型,助力AI从虚拟环境走向物理世界。

群核科技发布3D高斯语义数据集,给机器人装上“空间大脑”

量子位
量子位 · 2025-07-25T08:32:20Z

本研究提出了3DTown框架,旨在从单张俯视图生成逼真的三维城镇,解决传统3D场景获取的高成本和低效率问题。该方法通过区域生成和空间感知技术,确保场景一致性和几何质量,实验结果显示其优于现有技术。

Constructing a 3D Town from a Single Image

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本文提出了一种新的评估方法——代理忠实度(SF),解决了现有解释方法忠实度评估不足的问题。研究表明,引入空间感知显著提高了解释的忠实度,最佳忠实度(OF)在多种情况下提供更准确的解释,并在处理不同领域的数据和对抗样本时表现出更好的鲁棒性。

面向空间感知和最佳忠实度的基于概念的解释

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码