小红花·文摘

本文介绍了新的SIP数据集和D3Net模型，填补了RGB-D信息在人类活动场景中突出对象检测方面的空白。通过评估32个模型和18个部分在7个数据集上的表现，D3Net模型超过了竞争者，为该领域的研究提供了强有力的模型。该模型可以从实际场景中提取突出的物体掩码，并以65fps的速度进行背景更改应用。