从图像集合中学习具有状态、姿势和视点变化的物体不变表示

原文约2500字,阅读约需6分钟。发表于:

在学习物体的识别和检索的对象表示中,我们将更常用的其他不变性增加了一个不变性 - 状态不变性 - 通过状态不变性,我们的目标是设计一个具有类似能力的神经架构,以捕捉到物体形状结构变化时的鲁棒性。为了实现这一目标,我们提出了一个新颖的数据集,ObjectsWithStateChange,它捕捉了物体图像中的状态和姿态变化。通过使用所学嵌入空间中每个时期后的相似关系指导训练过程,我们还提出了一种使用课程学习策略,该策略通过比较视觉上相似的对象来增强模型捕捉微细变化物体的辨别特征的能力。我们相信,这种策略可以提高在涉及具有状态变化的微细任务上的性能,不仅在我们的新数据集上,还在其他具有挑战性的多视图数据集上,如 ModelNet40 和 ObjectPI。

本文介绍了一种利用状态不变性来学习物体识别和检索的方法,通过新的数据集ObjectsWithStateChange捕捉物体图像中的状态和姿态变化。作者提出了一种增强模型捕捉微细变化物体特征的课程学习策略,以提高在具有状态变化的微细任务上的性能。

相关推荐 去reddit讨论