ViDSOD-100: 一个新的 RGB-D 视频显著物体检测数据集和基线模型
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了新的SIP数据集和D3Net模型,填补了RGB-D信息在人类活动场景中突出对象检测方面的空白。通过评估32个模型和18个部分在7个数据集上的表现,D3Net模型超过了竞争者,为该领域的研究提供了强有力的模型。该模型可以从实际场景中提取突出的物体掩码,并以65fps的速度进行背景更改应用。
🎯
关键要点
- 提出了新的SIP数据集和D3Net模型。
- 填补了RGB-D信息在人类活动场景中突出对象检测的空白。
- 比较了32个模型,评估了18个部分。
- D3Net模型的表现超过了先前任何竞争者。
- 为该领域的研究提供了强有力的模型。
- 能够有效提取实际场景中的突出物体掩码。
- 在单个GPU上以65fps的速度进行背景更改应用。
➡️