ICGNet: 实例中心抓取的统一方法

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于属性的机器人抓取的端到端学习方法,利用门控-注意力机制融合了工作空间图像和查询文本的嵌入,学习预测实例抓取可行性,并利用抓取前后的对象持久性学习了视觉和文本属性的联合度量空间。模型在模拟中自我监督,可推广到新的对象和真实场景,并演示了只用一个抓取数据即可适应新对象的能力。在未知对象上,实验结果表明,我们的方法实现了超过80%的实例抓取成功率,优于几个基准模型。

🎯

关键要点

  • 提出了一种基于属性的机器人抓取的端到端学习方法。
  • 利用门控-注意力机制融合工作空间图像和查询文本的嵌入。
  • 学习预测实例抓取可行性,并学习视觉和文本属性的联合度量空间。
  • 模型在模拟中自我监督,可推广到新的对象和真实场景。
  • 展示了只用一个抓取数据即可适应新对象的能力。
  • 在未知对象上,方法实现了超过80%的实例抓取成功率,优于几个基准模型。
➡️

继续阅读