本文介绍了新的SIP数据集和D3Net模型,填补了RGB-D信息在人类活动场景中突出对象检测方面的空白。通过评估32个模型和18个部分在7个数据集上的表现,D3Net模型超过了竞争者,为该领域的研究提供了强有力的模型。该模型可以从实际场景中提取突出的物体掩码,并以65fps的速度进行背景更改应用。
完成下面两步后,将自动完成登录并继续当前操作。