量子位 ·

2700GB高质量数据，训出空间智能SOTA，背后秘诀全栈开源

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

蚂蚁灵波开源了2700GB的LingBot-Depth-Dataset数据集，包含300万对RGB-D数据，旨在解决机器人感知空间的挑战。该数据集涵盖多种真实场景，增强模型的泛化能力，推动具身智能的发展，减少对昂贵硬件的依赖。

🎯

关键要点

蚂蚁灵波开源了2700GB的LingBot-Depth-Dataset数据集，包含300万对RGB-D数据。
数据集旨在解决机器人感知空间的挑战，增强模型的泛化能力，推动具身智能的发展。
机器人常用RGB-D相机感知空间，但在透明物体或反光表面时容易失效。
行业过去依赖硬件补短板，缺乏高质量数据导致模型泛化能力弱。
LingBot-Depth-Dataset包含200万对真实数据和100万对合成数据，覆盖多种真实场景。
数据集使用多款主流深度相机采集，确保数据分布的多样性。
蚂蚁灵波的开源数据基建缓解了开源社区缺乏真实场景数据的问题。
LingBot-Depth模型在多项基准测试中实现了SOTA，能够稳健抓取透明和反光物体。
蚂蚁灵波还开源了LingBot-VLA和LingBot-World，推动机器人决策能力。
物理AI数据先行，强调数据和算法架构的重要性，优先考虑软件手段而非硬件堆叠。

❓

延伸问答

LingBot-Depth-Dataset数据集的主要内容是什么？

LingBot-Depth-Dataset数据集包含2700GB的高质量数据，包含300万对RGB-D数据，旨在解决机器人感知空间的挑战。

为什么RGB-D相机在某些情况下会失效？

RGB-D相机在遇到透明物体或反光表面时容易失效，导致机器人感知异常。

蚂蚁灵波开源的数据集如何推动具身智能的发展？

通过提供丰富的真实场景数据，LingBot-Depth-Dataset增强了模型的泛化能力，推动了具身智能的发展。

LingBot-Depth模型在基准测试中表现如何？

LingBot-Depth模型在多项权威深度补全基准测试中实现了SOTA，能够稳健抓取透明和反光物体。

蚂蚁灵波开源的其他模型有哪些？

除了LingBot-Depth，蚂蚁灵波还开源了LingBot-VLA和LingBot-World，推动机器人决策能力。

数据和算法架构在物理AI中的重要性是什么？

数据是AI迭代的基石，而算法架构则是将多个算法整合形成合力的能力，二者对提升空间智能至关重要。

🏷️

继续阅读

黄仁勋也站台的抱抱脸机器人卖爆了，背后公司竟来自中国
由中国矽递科技打造的桌面机器人Reachy Mini，具备多模态交互能力，销售火爆。该机器人为开源平台，支持开发者二次开发，旨在降低参与门槛，推动具身智能的发展。
全栈AI安全能力，构筑智能时代防护屏障
绿盟科技的“清风卫”AI安全一体机在大会上引起关注，作为新研发的AI安全产品，提供多维度的安全防护，涵盖大模型安全和数据安全，满足AI时代的用户需求。
机器人线下真机对线打PK！这届黑客松可太会玩了
在深圳举行的全球首届具身智能开发者大会上，20支顶尖高校队伍参加机器人对抗赛，测试模型的适配与部署能力。比赛提供高性能硬件和全流程支持，旨在推动具身智能的...
实测拿215项SOTA的Qwen3.5-Omni：摄像头一开，AI给我现场讲论文、撸代码
Qwen3.5-Omni是一款全模态AI，支持视频会议、论文解读和代码生成。在215项SOTA测试中表现优异，其音视频理解能力与Gemini 3.1-Pr...
一日一技 | 如何正确进行 vivo Log 的色彩空间转换
vivo X300系列发布后，其专业视频模式和vivo Log引起了摄影爱好者的关注。文章探讨了vivo Log的色彩空间转换，强调使用色彩空间转换（CS...
AVS4，开启全面“领跑”世界的超高清智能视频新篇章
高文院士指出，中国AVS标准实现了历史性跨越，下一代AVS4将结合传统与AI技术，提升编码性能，进一步降低码率，推动超高清视频产业发展，助力中国科技自立自强。