小红花·文摘 - 小红花技术领袖俱乐部

Realtime-VLA V2——如何让vla运行的更快：从让π0实时抓取下落的钢笔到让 VLA 运行得更快、更平滑且更精确

Realtime-VLA V2——如何让vla运行的更快：从让π0实时抓取下落的钢笔到让 VLA 运行得更快、更平滑且更精确

结构之法算法之道 ·

蚂蚁灵波推出的LingBot-Depth深度视觉模型，解决了机器人识别透明和反光物体的难题。该模型通过掩码深度建模技术提升深度感知能力，显著提高了机器人在复杂环境中的抓取成功率。团队还开源了模型及300万RGB-D数据集，推动行业发展。

机器人看不清，蚂蚁给治好了

量子位 ·

本文介绍了一种新的实例分割解决方案SKU-Patch，利用少量图像补丁预测掩模，避免手动操作和模型重训练。实验证明SKU-Patch性能超过现有方法，对50多个SKU的平均抓取成功率接近100％，显示出其有效性和实用性。

SKU-Patch：面向 Auto-Store 中未见物体的高效实例分割

BriefGPT - AI 论文速递 ·