蚂蚁灵波推出的LingBot-Depth深度视觉模型,解决了机器人识别透明和反光物体的难题。该模型通过掩码深度建模技术提升深度感知能力,显著提高了机器人在复杂环境中的抓取成功率。团队还开源了模型及300万RGB-D数据集,推动行业发展。
本研究提出GLOVER框架,旨在解决机器人在开放词汇操作中对物体可抓取部分的推理问题。通过微调大型语言模型,GLOVER在物体部件识别和抓取成功率上分别达到了86.0%和76.3%。
本文介绍了一种新的实例分割解决方案SKU-Patch,利用少量图像补丁预测掩模,避免手动操作和模型重训练。实验证明SKU-Patch性能超过现有方法,对50多个SKU的平均抓取成功率接近100%,显示出其有效性和实用性。
完成下面两步后,将自动完成登录并继续当前操作。