本研究提出了一种创新的三维物体检测方法DEST,利用交互式状态空间模型克服了DETR在三维室内物体检测中的性能限制。实验结果表明,该方法在ScanNet V2和SUN RGB-D数据集上显著提升了检测性能,创造了新的SOTA标准。
CoMAE是一种单模型自监督混合预训练框架,通过交叉模态对比学习和遮蔽图像建模来统一自监督表示学习算法。CoMAE在SUN RGB-D和NYUDv2数据集上的实验表明,其预训练模型具有与大规模和监督RGB数据集预训练方法相竞争的效果。
完成下面两步后,将自动完成登录并继续当前操作。