量子位 ·

2700GB高质量数据，训出空间智能SOTA，背后秘诀全栈开源

💡 原文中文，约2700字，阅读约需7分钟。

📝

内容提要

蚂蚁灵波开源了2700GB的LingBot-Depth-Dataset数据集，包含300万对RGB-D数据，旨在解决机器人感知空间的挑战。该数据集涵盖多种真实场景，增强模型的泛化能力，推动具身智能的发展，减少对昂贵硬件的依赖。

🎯

🔎

LingBot-Depth-Dataset数据集的开源为机器人感知领域提供了宝贵的资源。通过包含300万对RGB-D数据，该数据集不仅增强了模型的泛化能力，还为研究者提供了丰富的真实场景数据，帮助解决机器人在复杂环境中的感知问题。

文章强调了在提升机器人感知能力时，优先考虑数据和算法架构的重要性，而非单纯依赖昂贵的硬件。这一观点与自动驾驶领域的共识相呼应，表明在物理AI的应用中，数据驱动的策略更具可持续性。

LingBot-Depth-Dataset通过多款主流深度相机采集数据，确保了数据的多样性。这种多样化不仅提高了模型的适应性，也为不同传感器的研究提供了基础，推动了机器人技术的进步。

❓

LingBot-Depth-Dataset数据集包含2700GB的300万对RGB-D数据，旨在解决机器人感知空间的挑战。

RGB-D相机在遇到透明物体或反光表面时容易失效，导致机器人感知异常。

该数据集通过提供丰富的真实场景数据，增强了模型的泛化能力，减少了对昂贵硬件的依赖。

LingBot-Depth模型在多项权威深度补全基准测试中实现了SOTA，表现优异。

开源数据基建缓解了开源社区缺乏真实场景数据的问题，推动了具身智能的发展。

蚂蚁灵波开源了LingBot-VLA和LingBot-World，推动了机器人在视觉、语言和动作上的决策能力。

🏷️