本文提出了一种新型自回归模型,作为有效的单目深度估计器,克服了现有方法的局限性。该模型通过不同分辨率的深度图和自回归目标,在KITTI和NYU Depth v2数据集上显著提升了性能,并实现了最佳RMSE,为深度估计提供了新的思路。
本研究提出D$^3$epth方法,通过动态掩膜减少动态物体对深度估计的影响,并引入光谱熵模块以提高准确性。实验结果表明,该方法在KITTI和Cityscapes数据集上优于现有技术,具有重要的应用潜力。
本研究提出了MonoASRH框架,旨在解决单目三维目标检测中的全局意识不足和小目标遗漏问题。通过高效的混合特征聚合和自适应尺度感知回归,实验在KITTI和Waymo数据集上取得了优异的表现。
本研究提出了多种新方法以提升自监督单目深度估计的性能,包括自我关注、离散视差预测和基于Transformer的模型。实验结果表明,这些方法在KITTI和Make3D数据集上超越了现有技术,取得了最佳效果。
本文介绍了一种名为3DSSD的无锚点3D对象检测方法,基于稀疏特征图,具有轻量高效的特点。该方法通过稀疏2D特征图回归3D边界框,在KITTI和nuScenes数据集上表现优异。同时,提出了标签指导辅助训练和超点分组网络等改进技术,进一步提升了3D目标检测性能。
本文介绍了基于去噪扩散概率模型的深度估计技术,如MonoDiffusion和RenderDiffusion。这些模型通过自监督学习和合成数据,提高了深度估计的准确性和鲁棒性,尤其在KITTI和Make3D数据集上表现突出。此外,研究还探讨了其在虚拟现实和增强现实中的应用潜力。
本文介绍了一种利用三维全卷积网络的学习机制,能够稠密地预测每个三维点的检测分数和描述特征,并通过自监督的检测器损失来指导特征匹配结果。该方法在3DMatch和KITTI数据集上取得了最先进的结果,并在ETH数据集上展现了强大的概括能力,为实现准确快速的点云对齐提供了可靠的特征检测器。
Patch Refinement是一种两阶段的模型,用于准确检测和定位3D对象。在KITTI 3D对象检测基准测试中,它在所有三个难度级别上都优于以前的输入,仅使用了50%的训练数据和LiDAR信息。
本文介绍了一种名为FG-Depth的框架,利用预训练的Flow-Net的先验知识来引导优化,提出了流蒸馏损失和基于先验流的掩模来提高模型性能以及消除噪声。实验结果表明,该方法在KITTI和NYU-Depth-v2数据集上均达到了最领先的效果。
本文提出了一种基于鲁棒学习思想的目标检测框架,通过使用在源领域上训练的检测模型获取目标领域的嘈杂标签数据,从而实现对领域适应问题的处理。通过在SIM10K、Cityscapes和KITTI等数据集上验证,与现有方法相比,本文方法显著提升。
完成下面两步后,将自动完成登录并继续当前操作。