让机器人“看清”三维世界,蚂蚁灵波开源LingBot-Depth模型

💡 原文中文,约1500字,阅读约需4分钟。
📝

内容提要

蚂蚁灵波科技开源了LingBot-Depth模型,提升机器人和自动驾驶的三维视觉能力。该模型利用“掩码深度建模”技术,解决透明和反光物体的深度感知问题,显著提高深度图的完整性和清晰度。

🎯

关键要点

  • 蚂蚁灵波科技开源LingBot-Depth模型,提升机器人和自动驾驶的三维视觉能力。
  • LingBot-Depth模型基于奥比中光Gemini 330系列双目3D相机的数据,专注于环境深度感知与三维空间理解。
  • 在NYUv2、ETH3D等基准评测中,LingBot-Depth在室内场景的相对误差降低超过70%。
  • 传统深度相机在透明和反光物体面前存在深度感知难题,导致数据丢失或噪声。
  • 蚂蚁灵波科技研发了“掩码深度建模”技术,能够推断和补全缺失的深度数据。
  • LingBot-Depth模型已通过专业认证,在精度、稳定性及复杂场景适应性方面达到行业领先水平。
  • 实验显示,LingBot-Depth在复杂光学场景下输出的深度图平滑、完整,物体轮廓边缘锐利。
  • 灵波科技采集了约1000万份原始样本,支撑模型在极端环境下的泛化能力。
  • 蚂蚁灵波科技与奥比中光达成战略合作,计划推出新一代深度相机。
➡️

继续阅读